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第 6 版棘-章娜备了-歸 絲料. 本槪辦财麟论 JS, UU- 雖有直接放 
技书中的、但它们的引入 对于一 些学生和专业人员来说是非常有用的主题都放在补充材料里 
子材料超出了本书的数学水平.拥有大批听众的教师和一些更高级的设计课程可能会从一些 
£材料的论题中 受益. 登录网页 http://tinyurl.com/Montgomery Experiment 可以获得这些 

















1. 学生社区 


电子版本 • 


课本网页的学生部分包括以下 内容： 

(1) 前面提及的补充 材料； 

(2) 本书各种例题和家庭作业问题（电子形式 

(3) 学生专埋范本. 

2. 教师社区 

课本网站的教师部分包括以下 内容： 

(1) 本书习題 解答； 

(2) 前面提及的补充 材料； 

(3) PowerPoint 讲稿幻 灯片； 

(4) 本书各种例題和家庭作业问题（电子形式 

(5) 学生专题范本. 

部分内容仅提供给使用本书作为教材的教师，有密码保护.可致倌 contact@turingbook. 
com 申请密码. 

•3. 学生解題手册 
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打棒的类型（特大尺寸的还是常规尺寸 的)； ⑵使用的球的类型（树胶的还是三片的)；⑶步行 
并手提高尔夫球棒还是乘高尔夫 球车; （ 4 )打球时喝的是水还是 啤酒; （5) 在上午打球还是在下 
午 打球； （6) 打球时天气是冷还 是热; ⑺高尔夫球鞋钉的类型（金属的还是软的⑻在有风的 
日子还是无风的日子打球. 

显然，还可以考虑其他的 因子. 假定我们主要感兴趣的就是这些因子 ■而 且，基于长期的比 
赛经验，我认为第 5-8 个因子可以忽略，这些因子之所以不重要是因为它们的效应非常小，没有 
实际意义.工獅槲学家通触綱_正赖的雜錄巾_倾子触以上的决策 
现在，考进怎样通过实 验检验第1〜4个因子对我的高尔夫成绩的影响.假定实验过程中最 

























































(见图 1.5d), 结果 如下： 


球和球關妓賴=^-^ 94 ： 8 ^ 90 - g- 8 - + 91 ： 93 + 91 =0.25 


些效应与0是否有显著差异.事实上，统计证据表明长打棒效应与0有显著差异，而其他两个效 

应与0没有显著差异.所以，实验结果提示我应该采用特大长打棒. 

这个简单的例子显现出析因实验的一个非常重要的特性，即析因实验可以高效率地利用实 
验 数据. 注意到这组实验包括8个观测值，所有观测值都用于计算长打棒、球和交互作用的效 
应.没有其他的实验策略可以这样高效率地利用数据，这是析因实验一个重要且有用的特性. 

可以将析因实验的概念推广到3个因子.假定希望研究长打棒类型、球类型以及饮料类型 
对高尔夫得分的效应，并且假定这3个因子都有两个水平，析因实验的设计可以如图 1.6 所示. 
注意到各有两个水平的3个因子有8个试验组合，8个试验点可以在几何上用立方体的8个顶 
点来 表示. 这是一个2 3 析因设计的例子.因为我只想打8轮高尔夫球，所以，此次实验要求我每 
轮只能打图 1.6 中的8个顶点所代表的其中一种组合.但是，与图 1.4 中的二因子析因设计相 
比, 2 3 析因设计在因子的效应方面提供了相同的信息.例如，若图 1.4 中的二因子设计中的每轮 
实验重复两次，则在这两个设计中，都有4个试验提供关于常规长打棒的信息, 4个试验提供关 
于特大长打棒的信息. 



图 1.7 显示了如何在2 4 析因设计中研究所有的4个因子一长打棒、球、饮料和行进方式 
(步行或乘车).像在任意的析因设计中一样，它利用了因子水平组合的所有可能.由于所有4个 
因子都有两个水平，所以这个实验设计在几何上仍然可以用立方体（实际上是超立方体）表示. 


行进 H 式 



图 1.7 涉及长打棒类型、球类型、饮料类型以及行进棋式的四因子析因实验 
—般地， 如果有 k 个因子，每个因子有两个水平,那么析因设计就要进行 2* 轮.例如，图 1.7 
中的实验要进行16 轮. 显然，随着感兴趣的因子数的增加，要求的轮数也迅速增加.比如，具有 
10个因子、每个因子都有两个水平的实验需要进行1 024轮.这无论从时间还是资源角度来说， 
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测差异受测量系统或量具内在的变异性的直接影响.又如，在半导体制造实验中，用一个氧化炉 
在特定的气流率和时间的条件下同时加工4个晶片，测量每个晶片的氧化物厚度.和前例相同， 
这4个晶片的测量不是重复而是重复测量.在这个案例中，这 4 个 测量值 反映了特定的炉次中 
晶片间差异和变异性的其他来源.而重复既反映试骑间的变异又反映试验内 (内在） 的变异 • 

区组化是用来提高实验精度的一种设计技术,使用它我们在感兴趣的因子之间进行比较.区 
组化常用于减少或消除讨厌因子带来的变异■讨厌因子是指可能影响实验响应而我们不直接感 
兴趣的因子•例如，在一个化学过程中，要在所有的轮次中使用两批原材料■然而，由于供货商之 
间的不同可能造成批次间的差异，如果我们对这种影响不是特别感兴趣,就可以将原材料的批次 




说明区组化原理. 

实验设计的3个基本原理（随机化、重复和区组化）是每个实验的重要 部分. 通贯本书，我 
们将反复地解释并强调这些基本 原理. 











































因果图采用传统意义的原因去组织信息和潜在的设计 
和机器.我们注意到一些单个原因可以直接作为包含 
i 和真空)，而其他列出的潜在区域则需进一步研究，才 
S 的工艺流程),剩下的原因可能导致其他的因子，它们 

















的选择涉及考虑样本量(重复次数),选择合适的实验次序,确定是否划分区组或者是否涉及其他 
随机化限制.本书讨论一些较重 要的实 裝设计类型，对于大多数问题来说，你都可以从中选择到 
合适的实验设计类型. 

在实验设计的这个阶段,有许多交互式的统计软件包 支持. 实验者可以输入包括因子数、水 

平和范围的信息，这些程序将会给出一个可供考虑的设计选择或推荐一个特定的 设计. （在大多 

数情况下，我们更愿意看到一些选择方案而不是依赖计算机的推荐 .） 这些程序通常也会提供一 
个工作表（带己随机化的试验次序）用于指导实验的进行. 

在选择设计时，时刻记着实验的目的是很重要的 • 在很多工程实验中，我们己经知道，有些 







困此._常賴进行试—验些其二=^^^^^^ 

25%. 这样可以确保有足够的资源用来进行确认试验并最终完成实验的最后目的 
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1 中粘结抗拉强度数据的点图 


与一次试驗 (run). 每次试验都是有区别的，所以在试 
吉果上存在波动（又叫作《音).这种嗓音通常称为实验误差或称为误差 (error) . 这是一种统计 
6由于不可控制的变异而引起的，因而通常是不可避 免的. 误差或噪音的出现意味着相应 
(即粘结抗拉强度）是一个 M 机变量 (random variable). 随机变置可以是离散型 (discrete) 
可以是连«型 (continuous) 的.如果随机变量所可能取值的集合是有限的或可数无限的， 
机变最是离散型的;如果随机变1：所可能取值的集合是一个区间,则此随机变量是连续型 


1. 变异性的图示法 






















= 可 以用财 I 效 2 / » Wlitt(expected value ) 或醜纽 y 触期试難 T 均值来表示均值， 
f 厂 yf ( y ) dy , y 为连续里 

"" E<9) = ( EM,), ㈣ 

其中 E 表示期望值算子. 

-个橛 率分布的分散程度或 者离中 趋势，可以 用方差 (variance) 来度氣 方差定义为 
a ( j ^ (V - t *) a f ( p ) dy , y 为连续型 
a ~| _£ ( v - m ) 2 p (»), i/ 为 离敝型 (2 - 3) 

方差可以由期望来表示,因为有关系式 


•后， 因力力雜广 S 朗，力了方便,細找-个方差算子V: 

V(y) = E[( 1/ -^) 3 j = tr » 














E ( f ) = a 2 (2.11) 

平方和的自由度等于平方和中独立元素的 个数. 例如， (2.9) 式中的= t(Vi-V) 2 由 n 个 
元索扒 - F , W _ S , … ，恥 - 5的平方和组成,但是 E ( l « - 1?) = 0,所以这些元素并非都是独 
立的.实际上，只有其中的 n — 1个是独立的,所以有 n - 1个自由度. 

4. 正态分布及其他抽样分布 

如果己知样本所在总体的概率分布,通常我们能够确定一个特定统计蠹的概率分布.统计量 
的概率分布叫做抽样分布 (sampling distribution ). 现在，我们简要讨论几个有用的抽样分布. 

最重要的一个抽样分布就是正态分布 (normal distribution ). 如果 y 是一个正态随机变童， 
则 y 的概率分布是 

/(») = ^ e - (1 翊 ' - oo < tf<oo (2.12) 

其中一 oo < #* < oo 是分布的均值, a 3 >0 是方差.正态分布如图 2.5 所示. 



图 2.5 正志分布 


因为作为实验误差的结果而体现在样本中的差别通常能用正态分布来描述,所以正态分布 
在实验设计的数据分析中起着极为重要的作用_很多重要的抽样分布亦可通过正态随机变量来 
定义. 我们常用记号 1 / 〜 W (/ i ,( T a ) 表示 y 是具有均值 p 和方差 < r 2 的正态分布 • 

正态分布的一个重要的特殊情况是标准正态分布 (standard normal distribution ). 即 /x = 0 
并且 ( T 2 = 1.如果 y 〜 则随机变量 


(2.13) 

服从标准正态分布，记为；！ 〜 iV(0,l). (2.13) 式所示的运算通常叫做正态随机变量 w 的标准 
ft(standardizng). 累积的标准正态分布见附录的表 1. 

很多统计方法都假定随机变量服从正态 分布. 中心极限定理常作为近似正态性的一个合理 
依据. 

定理 2.1 中心极限定理 

若奶， ya , …， y » 是 n 个孩立同分布的随机吏量，具有 E ( j /,) = /!和 V ( W ) = < r 2 ( 都是有 
限的)，且 x =扒+ j / 2 + • • • +如，則当 n — oo 时， 





通常认为，实验中的误差来自多个独立源，且以加法方式出现，因此正态分布就成为这种联合实 
验误差的一个近乎合理的 模型. 

能利用正态随机变量定义的-个重要的抽样分布是卡方分布或一分布若幻， 约… 办 
是独立的正态分布的随机变量,其均值为0,方差为1,简记为 NID (0, 1), 则随机变量 
x = zi+zl + -- + zi 

服从自由度为 A : 的分布 . 的密度函数是 

’⑷= 2^ r ^) xih，3) ~ le ~ X/2 ' x>0 (2.14) 

几个 X 2 分布如图 2.6 所示.这一分布是非对称的或 偏峰的 (8kewed) ， 其均值与方差分别为 

X 2 分布的百分位数表见附录中的表 III . 



图 2.6 几个卡方分布 


咖 t 个从卡方分布的随机变 * 的例子，假设 》■' m * 来自 叫夕） 分布的-个 
机梓不，则 

= ~^3- (2.15) 

也就是说， I # 服从自由度为 n — j 的卡方 分布. 

计肺变换 • （ 2 . 15 )式__果是十分餅的且会反 
复出现，正态随机变薰的平方和除以口 2 服从卡方 分布. 

由 (2.8) 式可知,样本方楚可写为 






^ 1 r 卯 坑 TT 冨的 Wf， 芩思两 个具有 ■共同方差 y 的独立正态总体.若 yil 

奶 2 , • • • ，的〜是第1 ‘个总体中的 n, 个观测值的随机样本，的,，於 2 , . _ . ,於„ 2 是第 2 个总体中 
的 n 2 个观测值的随机样本，则 



其中埒与筠是两个样本方差.这-结果直接由 （2.15) 式与 （2.20) 式得出. 

24关于均值差的推断，随机化设计 

现在回到 2.1 节中提出的硅酸盐水泥砂浆问题上来.那里研究过两种不间的砂浆配方的粘 
结抗拉强度是否有所差励问题.本节将利用比较两个处理均值的假设检 K(hypethesis testing) 
和置倌区问 (conscience interval) 方法来分析简单比较实验的 数据. 

T 朗了—个完全脚 1 化雜设计.賊類计巾，_都财作是来自 

正态分布的一个随机样本 • 

2.4.1 假设检验 




statistic), 然后拒绝或者不拒绝零假设 // 0 . 这个程序的一部分用来找出检验统计量的一个导致 
拒绝 Wo 的数值集合.该数值集合叫做检验的临界域 (critical region) 或拒绝域 (rejection region). 

检验假设时可能会发生两类错误.如果当零假设为真时被拒绝了，则产生第I类错误.如果 
零假设不真时却未被拒绝，则出现第II类错误.这两类错误的概率用特定的符号表 示为： 



= P (第II类错误 ） = P (未拒绝为伪） 

有时,用检验的势来操作更为方便，其中 

势=1 一 = P (拒绝为伪） 

假设检验的一般程序是规定第I类错误的概率值 a ， 通常叫做检验的 ffi 著性水平 (significance 
level), 然后设计检验程序，使第II类错误的概率々的值适当小 • 

3. 两样本 * 检验 

设想我们能假设两种砂浆 IB 方的粘结抗拉强度的方差是相同的，則在完全随机化设计中用 
于比较两个处理均值的一个恰当的检验统计量是 



(2.24) 










































两样本 i 检验方法的 Minitab 输出. 注意输出包括了两个样本 的一些 描述性统计量 .（ 缩写 “ SE 
mean” 指賴陳准误， s /v^) 和―些关于两个驢差翔 S 躯贿息满们触 2.4.3 节 
和 2.5 节中讨 论). 这个程序也能检验感兴趣的假设，通过分析师给定备择假设的种类 （《n 0t = ” 
意味着和给定的 a 的水平（这里 a = 0.05). 

_表 2.2 Minitab 中的两样本 t 检轚 


TWo-sample T for Hodlfied vs Unmodified 



输出包括 t 0 的计算值 ' P 值（称为显著性 水平） 和根据给定的 a 值做出的决策•注意 t 统 
卜量的计算值与通常手算的值稍^不同， P =0.042. 许多软件包并不能输出小于-些预定值 （比 

































































2.4.4 的情形 

如果检验 


而不能合驅齡辟~ <T! 瞒，顺样本 f 碰法娜稍触正.伽雛统计置为 


这个统计置不再精确地®从 t 分布•然而，如果用 


t3|h 

作为自由度 ，则紿 的分布相当接近于 < 分布•这种 t 检验的方法适用于正态概率图表 
不等的情形.可⑽ s 雌 m- 个公絲触不勒差娜蝴值隸的置信区间 
2.4.5 与为已知的情形 

如果两个总体的方差都是已知的，则检验假设 


可以用统计童 


vlT^ 


SHFS 二士 

时 我们就拒绝执，其中 2：。 /2 是 fee 准正态分布的上 a /2 百分位数. 

■«:==:■ ===不的譲定从正—中抽样可以用中 

方差己知时关于屮-抝的 100(1 - <»)%的置信区间是 

Vl ~ Vi ~ Za/a ][^ + ^ “HdV2 + z a/2 ^ + ^ (2.34) 

正如前面所注明的那样，置信区间常常是假设检验方法的-个有用的补充 



2.4.6 均值与已知值的比较 

有些实验仅比较一个总体的均值 M 和一个已知值抑.这一傾设是 


如果总体是正态的，其方差己知，或者总体是非正态的，但样本量足够大以至于可以用中心极限 
定理，則这一假设可以直接用正态分布来检验.检验统计童是 


20 =辕 ㈣) 


如果 H 0 : m =抑 为真，则20的分布是况 (0, 1). 因此，对机： M =仲的判别法则是，如果 
|功| > z a/a , 则拒绝零假设.在零假设中均值的己知值 W 通常可由三种方法决定.可以根据过 
去的论证、知识或经验而 得到； 可以是描述所研究情况的某种理论或棋型的结果：也可以是合同 
规定的结果. 

真实总体均值的 100(1 _ «)%置信区间是 

V-z a /2tr/yyn + x a/2 er/Vn (2.36) 


例 2.1 —供应商向一纺织厂提供一批纤维.工厂需要了解这批纤维的平均抗断强度是否超过200 psi . 

如果超过200 pei , 工厂就接收这些 纤维. 过去的经验表明，抗断强度方差的一个合理值是100 ( psi ) 2 . 需要 

检舱的假设是 


4备择假设.于是，仅当零假设 
取4个试件，观测到的平均抗 I 




i>a = 0.05, 从附录的表1中査得= 

aaoopBi. 

如果总体的方差未知,就必须加上总 


r o 被拒绝，我们得出 
S 的偏离正态性兴 



以 S 代替 tr, 得检验统计貴 


: M =坤，则要用样本方差5 2 来估计(7 2 •在 （2.35) 式中 

*° =錶 ⑽) 


当|知| > *a/2.n-l 时，拒绝零假设开0 : M = P0, 其中 *Q/2,n-l 是自由度为 n — 1的 f 分布的 
上0/2百分 位数. 此时的 100(1 - £»)%置倌区间为 


V-ta/2.n-lS/Vn^ H i 


(2.38) 


2.4.7 小结 

表 2.3 和表 2.4 简要地列出了上面关于样本均值所讨论的检验方法.对双边和单边备择假 
设都列出了拒绝域. 










检驗统时 lifti" 

l*o| > <a/2.n 

*0= §7^ *0< - tc . n - 



关于均值差的推断，配对比较设计 


-台硬度试祕，它聽力黯触触紐 A- 块金贴件，郝廳触紗压入的刺 
叩可得知试件的 硬度. 这台机器有两根不同的压头，虽然两根压头产生的测置精度 （变 异性 ） f 
?相同，但仍倾-根齡得麵财賴钱-根砂賴麵■賴是不同的 

苎，方法如下.随机选取一批（例如，20 块） 金厲试件.这些试件的一半用压头工检测 今 

































































































第 3 章单因子 实验： 方差分析 


L —个例子 
!方差分析 
I 固定效应模型的分析 
3.3.1 总平方和的分解 
3.3.2 统计分析 
3.3.3 棋型参数的估计 
3.3.4 不平衡数据 
棋型适合性检测 
3.4.1 正态性《设 
3.4.2 依时间序列的残差图 
3-4.3 残差与拟合值的关系 ffi 
3.4.4 残差与其他变*的关系图 
结果的实际解释 
35.1 回归模型 
3.5.2 处理均值的比较 
3.5.3 均值的图解比较法 
3.5.4 对照法 
3.5.5 正交对照法 

3 5.6 用来比较全部对照的 SchefK 方法 

3.5.7 处理均值的配对比较法 

3.5.8 将各个处理均值与一个控制进行比较 


3-6 计算机输出示例 
3.7 确定样本量 



3.10.2 关于秩交挟的一般评论 
第3章补充材料 
S 3.1 因子效应的定义 
S 3.2 期簠均方 
S 3.3 W 的置侑 区间 
S 3.4 处理均值的联合置信区间 
S 3.5 定釐因子的回归模型 
S 3.6 关于估计函数的更多内容 
S 3.7 回归与方差分析的关系 


第2章讨论了 tfc 綱个餅麵种处麵摊.讎，義齡泥陳合抗麵 度魏涉 
及了两种不同砂浆 配方. 描述这类实验的另一种方法是二水平的单因子实验，这里的因子是指砂 
浆配方，二水平 I* 顿种不關防.财賊实馳 H 子 都紗预 个水平的.林侧重介绍 

关于具有 a 个水平（或 a 个 处理） 的单因子实验的设计与分析方法.假定实验都是完全随机化 

的. 


3.1 一个例子 

在集成电路的许多生产步骤中，晶片被一层材料（如二氧化硅或某种金属）完全覆盖.通过 
对掩模的蚀刻有选择性地除去不需要的材料,从而创建电路模板、电互连以及必须扩敗的或者金 






电极之间的间除产生等离子.等离子体的化学种类是由所使用的特定气体决定的.破氟化合物， 
比如 CF 4 ( 四氟甲烷）或 C 2 F 6 (六氟乙烷)，通常被用在等离子蚀 刻上. 但是根据应用情况的不同， 
也常使用其他的气体或混合气体. 





图 3.1 单晶片等离子蚀刻设备 


工程师要研究这套设备的 RF 功率设置与蚀刻率间的关系.实验目的是建立蚀刻率与 RF 
功率之间关系的棋型，以确定达到所需的目标蚀刻率的功率设置.她选定了气体 (C 2 Pe) 和间隙 
(0.80 cm), 想检验 RF 功率的4个 水平： 160W, 180W, 200W 和 220W. 她决定在 RF 功率的 
每个水平上检驗5个晶片. 

这是一个因子水平 a =4和重复 n =5的单因子实验.这20个试驗都是按照随机次序进行 
的. 一种生成随机次序的更高效方法是将20个试验输入电子表格 （Excel), 用 Rand() 函数产 
生一列随机数，以此排序. 

假设从这个过程中获得的试驗次序是 



为防止未知讨厌变童的影响,随机化试验次序是必要的.因为实舱中讨厌变量的变化也许会 
超出控制范围，从而损害实验 结果. 为了说明这一点，假定我们按原始的非随机化次序做20个 






用图示方法来检査实验数据的想法也很好.图 3.2aOt 明）展示了 RF 功率的每个水平的蚀 
刻率，图 3.2b 是蚀刻率关于 RF 功率的散点图.两类图都表明蚀刻率随着功率设置的增加而增 




























①这个论题的更多信息见第3章的补充材料. 














3.3 固定效应模漤的分析 53 


Ho : T1 = 7^2 = = Ta = 0 

Hi : Ti^tO 至少对于一个 i 

从而，我们说检验处理均值相等或检验处理效应 （TV) 为零.检验个处理均值相等的合适方法 
就是方差分析. 

3.3.1 总平方和的分解 


和 


方差分析 (analysis of variance) 这一名称来*于把总变异性分解为它的分童.总校正平方 

SS T = E - V-) a 


是数据总变异性的一个 度量. 直观看来，这是合理的，因为如果将除以一个适当的自由度 
(在现在的情况下，是 em - 1 = 7V - 1), 就得到 j/ 的样本方差.当然，样本方差是变异性的标准 
度量. 


总校正平方和 SS T 可以写为 


it(yii-V-) 2 = ttliVi-yJ + iya-Vi.)) 2 (3.5) 


EE (H) 2 =” E 瓜 -f?..) 2 +E E (糾- Vi .) a +2 ±t H.H) 
但是,等式最后的交叉乘积项为零，因为 

53 (V*j - Vi-) — Vi. - ny t . = yt. - n(y<./n) = 0 

因此，我们有 

£ I, <w - 5 - )a = " £ ® - - w 1 + 1,|, <»« - »<■>■ p «) 

(3.6) 式就是方差分析的公式,它表明，用总校正平方和来度量的一组数据的总变异性可以分解 
为： 处理平均值与总平均值之差的平方和，再加上在处理内部的观测值与处理平均值之差的平方 
和•现在，观测得的处理平均值与总平均值之间的差就是处理均值之间的差的度量，而处理内部 
的观测值与处理平均值之差却只是随机 误差. 于是，可以将 （3 . 6) 式用符号写为 
SS T = SS ita +SSE 

其中 SS 狀 叫做处理（即，在处理之间的）平方和，而 55 E 叫做误差（即，处理内 部的） 平方和 • 
因为有 an=N 个总观测值,所以，5办有 JV - 1个自由度.又因为有 a 个因子水平（以及 a 个 
处理平均值)，所以， SS M 有 a - 1个自由度•最后，任一处理内部有„个重复，给出„ - 1个 
自由度，它可以用于估计实验的误差，因为有 a 个处理，从而误差有 a („ - i) =a „-a = N-a 
个自由度. 

深入剖析基本方差分析恒等式的右边两项是有益的.考虑误差平方和 

SS E = ttiVii -瓦 .) 2 = g 味(物 -拓 .f| 




54 第 3 幸单因子实 驗：方 差分析 


由这一形式容易看出方括号内的项除以《 - 1就是第 i 个处理的样本方差，或 

EH) 2 


现在, fl 个样本方差组合起来给出公共总体方 差的一 个估计 如下： 

(»-1) 埒 + (n-l) 珀 + ••• + (n-l)S2 _ £ [ 墓 ( 讲广 Fi . )2 | SSb 
(n-l) + (n-l) + ... + („_i) = A f . = (iV - o) 


x) 就是在 a 
a 个处理均 1 


nt ( Vi .- V ：) 3 


i: * i §dlU 3 /(«-i) 
(!/<.-F..) 2 /( o -1) 


是处理均值都相等时 a 2 的一个估计. 

估计处理平均值的方差〆所以当处 
来估计 《 7 2 . 

方差分析恒等式[(3_6)式 j 给提供了两个估计 一 -个根据处理内部的固有变异性， 
-个根据魏之議变雜.如果舰馳贿賴，綱种估计雌針分觥；侧，我们 
就推测观测麵差异是由于处理均值之间的差异所引起的.尽管我们己经用直观论证研究了这 
一结果，但也可运用更形式些的推导. 

量 MS am = ❺与 MS e = !^ 称为均方.现在考察这些均方的期望值.考虑 

E(ilfSe)=E (^h) = ivb E [Sjg - »-) ! ] 

= A^ E [l.|, 1, «- 2n S^ + "£^] 

将模型 [(3.1) 式 1 代入此式，得 

狐卜占 W - g (| i (, + . +e „))] 











方差分析 
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： Mi = P 2 = M = M 4 与备 择傾设 历：部分均值不等.用 (3.8) 
方和 如下： 

75) 2 + ( M 2) 2 + ■•• + (710) 2 - (12 355) a /20 = 72 209.75 


因为 F 0 = 66.80 > 3.24, 所以我们拒绝《 0 ,并褥出处理均值不相同的结论.也就是说， RF 功率的设置 
对平均蚀刻率有显著影响.我们还可以计算检验统计置的 P 值.图 3.3 给出了检腧统计*凡的参考分布 
(^3,16). 显然，本例中 P 值非常小.因为 Fo . oi ,3,16 = 5.29 且 F 0 > 5.29, 所以可以得出结论：值的一 
个上界为 0.01, BPP < 0.01( 糟确 P 值为 P =2.88 x 10-®).. 

表 3.4 矗片油 刻实轚 的方差分析表 

方 差来渥 平方和 自由度 均方 Fb /»值 

11『功串 66 870.56 3 22 290.18 F 0 = 66.80 <0.01 


误差 5 339.20 16 333.70 

总和 72 209.75 19 



图 3.3 例 3.1 中检验统计置凡的参考分布 


1. 关于手工计算的更多内容 

读者可能注意到我们是用均值定义平方和的.也就是说，由 （3.6) 式， 

55处 * = n 石(民. -J?..) 2 

但是我们得到了利用总和的计算公式.例如，为了计算 SS 她 我们利用 （3.9) 式： 

ss —it yl -Ti 

理由是这样简单，并且，取与和 j/.. 不像 均值艮 .和 y 那样容易受舍入误差 (rounding error) 

的影响. 



















我们现在给出单因子棋型 
玫估计和处理均值的置信区间 


Vij = fl + Ti + 

® 后将证明总均< 


明总均值和处理效应的合理估计可由下式 给出： 


A=y.. 

十 iH , i = l,2，“，fl (3.11) 

这些估计童有相当直观的意义,注意总均值可以用观测值的总平均来估计,而任一处理效应只不 
过是处理均值和总均值之差. 

容易确定第 i 个处理均值的置倌区间 (confidence interval). 第 i 个处理的均值是 


IM = f*+ Ti 

Hi 的一个点估计是 jxi = U + fi = Vi .- 现在，如果假定误差是正态分布的，则毎一个是 
NID(/ii,<r 2 /n). 于是，如果^己知，则我们可用正态分布来确定置信区间.用作为 a 2 
的估计，就可以根据 t 分布来建立置信 区间. 因此，第 i 个处理均 值识的 100(1 - a)% 置信区 

间是 __ _ 

Vi. - ta/2,N-a^ < Vi. + t a/2 ,N-a^ (3.12) 
任意两个处理均值之差（即與一内）的一个 100(1- £«)%置信区间是 

Vi . - Vj . - 4： Hi - ftj < Vi . - Vy + (3.13) 

例 3.3 用例 3.1 的数据，得到总均值的估计置和处理效应的估计量为#1= 12 355/20 = 617.75 以及 



处理 4(RF 功串为 220W) 的均值的一个95%置倌区闾由 (3.12) 式算得是 

707.00 - 2.120^^|^ < 707.00 + 2.120^1^— 

707.00- 17.32 < 707.00 + 17.32 

于是，所求得的置倌区间是 689.68 < M4 < 724.32. 

联合置信区间 

(3.12) 式和 (3.13) 式给出的置倌区间表达式是一次一个的置信 区间. 也就 
是，置信水平1 _«只应用于一个特定的 估计. 但是，在许多问题中，实验者希望计算多个置信 
区间，每个均值或均值差都对应一个置信 区间. 如果有这样 r 个感兴趣的 100(1 - a)% 的置信 

区间， 》• 个置倌区间同时正确的概率至少为1 - fa •概率通常被称为实验方法误差率或总的 






r 两个优点•首先，相对来说，当样本量相等时，检验统计量对 a 个处理等方 
- «柳腾#对_顯紳她•棘，辦本量相等时， 











































R 照收集数据的时间顒序画出残差图有助于检测残差之间的相关性具有正 
导表明了正相 关性. 而这说明不符合误差 的獷立 性假定 (independence assun 






























































方差分析 


3.8 例 3.5 中峰值抹水 
lg5i. 的关系图 


表 3.10 变換后峰值摊水置数据 y* = ^的方差分析 


3.5 结果的实际解释 

























































服从 N(0,1) 分布. 现在用它的估计量（均方误差 MSb ) 替代未知方差 a 2 , 用统计童 


(3^5) 式中的假设.如果 (3.27) 式中的知|超过 ta/2 , n . a , 则零假设将被拒绝. 

第二种方法用 F 检验. 自由度为 "的 f 随机变量的平方取从分子自由度为1、分母自由度 
J J/ 的 P 分布.因而，我们用 


舊 - 

时，拒绝零 假设. 可以写出 (3.28) 式中的检 


其中单个自由度的对照的平方和为 


. (K 


与检验关于对照的假设相比，构建置信区间更为有用.假设感兴趣的对照为 

r = E CiM< 
i=l 

用处理的样本平均代替处理均值，有 

c=ioiVi. 


s ( li 颂 .) = 孟叫， 

)(1 一 a)% 的置倌区间为 


- W-。 拜 + (3.30) 

^用略来估计？的.如果 _) 式包含零，那么很明显我们将不能拒绝（咖） 




2. 标准化对照 

当感兴趣的对照不止一个时,用相同的尺度进行度量通常是有用的.这样做的 $法是将对照 
标准化使得它有方差如果对照 EciMi 用处理总和的形式写为 Ecil/i.. WJffi 
去除就得到方差为 a 2 的标准化对照.有效地,标准化对照为 


3. 不等的样本容量 

当每个处理的样本容量不等时，我们需要对前面的结论稍作修改.首先，注意对照的定义现 
在要求 S 0 

其他必要的改动是直接的,例如， (3.27) 式牟的 t 统计童变成了 


i 节中一个有用的特殊情况是正交对 照法. 系数为 {Ci} 与{呔}的两个对照是正交的， 


E mcidt = 0 




在很多时候，实验者预先并不知道他们想要比较哪些对照,或者，細感兴 ft 于多于 a _ i 
r 能的 比较. 在很多探索性的实验中，感兴趣的比较仅仅在进行了数据的初步检测之后才能 






发现. SchefF6(1953) 提出一种方法，可以用来比较处理均值之间的任意一个或所有可能的对照 • 
在 SchefK 方法中，任一可能比较的第I类错误至多是 

假设我们己确定了感兴趣的处理均值中的一组个对照组成的集合 

r u = Clu/ll + C2uM2 + • • • + CouPo « = 1,2, •• - ,m (3.31) 

以处理平 均值豇 中对应的对照是 

Cu = c\uVi. + C2 u 52. + ••• + c »«!?o. tt = 1，2, • • • ， m (3-32) 

且这一对照的标准误 (standard error) 是 

S Ca = (3-33) 

其中叫是第 i 个处理中观测值的 个数. 可以证明，用来比较的临界值是 

S a ,u = Sc u V(a - l)F a ,a-l,N-a (3.34) 

为检验对照 r u 与零有显著差异这一假设，可参照 C u 及其临界值.当 |C7 U | > s a , u 时，拒绝对 
照 r u 等于零的假设. 

Scheffg 方法还可用来构造处理均值间的所有可能对照的置信 区间. 所得的区间（不妨假设 

为 c u - < r„ < + Sa.u) 是 联合置 倍区间 (Simultaneous confidence interval), 也就是 





’错误率控制在选定的水平 《 上. 


而考虑特别构造的用于所有 a 个总体均值之间的配对比较的方法 • 

假定我们想要比较所有 a 个处理均值的配对，那么，想要检验的零假设就是 机：阼 =内 (对 
于一切 * # J)_ 有大量的解决这类问题的 方法. 

1. Tokey 检验 
假定在方差 
配对均值比较 

H o •• fH =Hi， 

1Wcey{195 

平至多是 a 的假设检验方法.他的方法也可以用于所有輯均值比较的置信区^ '对于这里 
区间，样本量觸时，联合 S 信水平为 100(1 -«)%;酣本 ft 不等时，联合 H 信水平至少沐 
100(1-a)%. 换句话说, Takey 方法将实酱总体错误率即“族，，< 

当者眼于配对均值时,这是一个很好的数据探究方法. 

几一法利用学生化极差统计通 (studentized range statistic) 

的分布，其中 5„, ax 和 P rain 分别是 p 个样本均值中的最大值和最小值 .p 
=上 Or% 点， 其中 f 是 MS E 的自由度） 的值. 当样本容貴相等时，如 

T a =q a (a,f) 

Ikey 检验就表明两个均值有显著性差异.等价地; 

100(1 — a )% 的置信区间如下： 

当样本 容量不 等时, （3.35) 式和 (3.36) 式分别变为 


“ . 一 Vi+ 卜 m)' w 


























































在任-实验设计问思中，-项重大的决策就是样本量的选择，即，确定实验的重复次数 ■- 
般来说，如果要检测出较小的效应，則与要检测出较大的效应相比,实验者需要更多的重复次数. 
本节讨论几种确定 样本量 的解决 方法. 虽然我们的讨论着眼于单因子设计,但大多数方法都可用 
于更为复杂的实验设计. 

3.7.1 抽检特性曲线 

抽推特性曲线 是某一 特定样本童的统计检验犯第 n 类错误的概率与某一反映零假设不成立 
程度的参_关賴.这些 ia 线可關于指导無者絲重賴次数，麟粉对醜中的重要 
的潜在差异反应灵敏. 

























84 第 3 聿羊因子实 蹌：方 差分析 


Minitab 用这种方法计算势，并找到单因子方差分析的样本容童.如下图所示.在表的上部 

我们要求 Minitab 计算 n = 4次重复 的势. 注意这些结果非常接近 OC 曲线所示的结论.表的 

下半部列出了为使目标势达到至少 0.90 的样本大小.再一次，结果与 OC 曲线的一致 • 





3.7.2 规定标准差的增量 

有时，这种方法有助于确定样本置.如果处理均值没有差异，则随机选一个观测值,其标准 
差是 a . 如果处理均值是有差异的，则随机选取的观测值的标准差是 


卜 + (» 

如果为一个观测值的标准差的增量选取一个百分数/>,超过该值就拒绝所有处理均值都相等的 
假设,这等价于选择 


即 


所以 


f a O) 


- = 1+0.01P 


(尸二百分比） 



v /( l +0.01 P) 2 -l 



V(l + 0.01 P ) 3 - l ( Vn ) 


(3.46) 






























前面对方差分析进行了直观的或启发式的研究.现在我们来进行更为正规的研究.这种方 
法对于后面理解更复杂设计的统计分析基础将是有用的.这种方法叫做一般回归显著性检验法 
(general regression significance test), 它的实质是为拟合模型与所包括的全体参数找出总平方 
和中的减少量，以及当模型限制在零假设时的平方和中的减少置.这两个平方和的差就是处理 
平方和,利用它可导出一个对零假设的检验.这一方法需要方差分析模型的参数的最小二乘估计 
量. 如在前面 3.3.3 节中所做的那样，我们已经给出了这些参数估计.但是，现在我们要给出正规 
方法. 


3.9.1 模型参数的最小二乘估计 







、山 饮出町儿 观刀任班. WJtt tf.9.1 15 干汧做的那样，正规方程组通常是 

5数，然后制:醜料个絲讀齡鴯翻•秘，骑-个更加容易的 
法则就可对任一实验设计模型直接写出它的正规方程组 
!中每个待估计的参数总存在一个正规方程 • 

正规方程的右埔项恰是包含与这个指定的正规方程有关的参数的所有观测值 


I,考虑单因子棋型.第1 


,因此，右端项是 V 




















它有 a _ 1个自 由度. 我们已由 （3.9) 式知,它就是 SS ^ 作通常的正态性假定，检验:: 
Ta = ■ •. = Ta = 0的恰当的统计置是 

n _ R ( r \ n )(/( a - l ) 

[l,S^ ^' T) ] / <JV_o) 

在零假设下，它服从 Ay，-* 分布•当然，这就是单因子方差分析的检验统计量. 

3.10 方差分析中的非参数方法 


3.10.1 Kruskal-Wallis 检验法 

当正态性假定不能被证明的情况下，实验者希望有不依赖于正态性個 
差分析 F 检验法. Kruskala 
用来检骏 a 种处理是完 全一枵 

产生的观测值.因为此方法设计需要对检验均值差很灵敏，所以，为 方脑见 ，将 Kruskal-Wa 
检验法视为检验处理均值相等的检验.相对于通常的方差分析而言, Kruskal-Wallis 检验法；| 
种非参败的方法. 


正明的情况下，实验者希望有不依赖于正态性假定的检驗法来代替方 
J and WaUis(1952) 提出了这样的一种方法. Kruskal-Wallis 检验法 
一样的零假设，而备择假设是由某些处理产生的观测值大于其他处理 


，首先将观测值 
的观测值的秩是 1. 


按升序排列,然后将每一观测值用它的秩 
对有结（观测值取值相同）的情况，则用 


(即位次，比方说7 

它们的平均秩•令苽.为笫 i 种处理的 秩和. 检验统计量是 

« =錐寄-〒 ] ⑽) 

其中叫是第 i 种处理的观测值的个数, JV 是观测值的总个数，以及 

史=妹 ㉔ -甲 j _ 

注意到 S 2 正好是秩的 方差. 如果没有结，則 s 2 =況(汉 + 1)/12, 且检验统计量简化为 

H= £ ^- 3(JV + 1 > (3-55) 

助）式几乎没有差别，且可以用较简单的形式 [(3.55) 
式]•如 果叫 适当大，比方说 S， 则在零假设成立的条件下，好近似服从 xL 分布•因此， 


当结的个数是中等程度时，（ 3 .54)式和 (3.56) 
式 J •如果适当大，比方说„ 4 > 5, J 

如果 

则拒绝零 假设. 也可以采用/>值方法. 


由供 (3= 式供 ; ^的数据及其对应的秩如表 314 所示. 因为有结，所以我们用（3_53〉式作为检》统计 






3.11 思考趄 91 



















































































第 4 章随机化区组，拉丁方，以及有关的设计 



4.1 随机化完全区组设计 






























这里阳 =M + T j + ^. 但是在本章中，我们将用效应棋型 （4.1) 式. 

是在涉及 RCBD 的实验中’我们的兴趣在于检验处理均值是否相等于是，所感兴趣的假设 
Hi :至少有一对炽 二 

因为第 i 个处 麟值〜 = (1/6) + T i + j 3 j)^ U + Ti , 写出上述 fi 设的-个等价方式是根 


刀$甘析很谷芴5■展到 RCBD ■以讲.表示处理丨下的所有观测值的总和，以表示在区组 
1 内所有麵值的总和， y_. 表示全体观测值的总和，心 a6 是观测值的总 个数. 用数学式表示为 


v= S l ^ VijSS S 1 Vi= ^ Vi (“) 

i 下观测值的平均值， L 表示区组内观测值的平均值,17表示全体 

Hf b ， Hifa , y.^vJN (4.5) 


5 S (yi, _i? - )2= S ~ ^ + - 5. ) + (VH - Vi. - V.j + V..)] 2 

将 （4.6) 式右端项展开，得 

tEivn-Vy^bt^. -y ) 3 + aT.(v,-v ^ 































































































110 第 4 幸随机化区组，拉丁方，以及有关的设计 

y«=M + r ( + ^+ 6i J * = (4-17) 

[J = 1.2,-•• ,b 

利用 3.9.2 节中对实 Ife 设计模型求正规方程组的规则，得 

M ：abfi+bfi +bfi + -- -+bf a +a0i + o/^j + - - - + a$t = y.. 
n: bfi + bfx + 0i+ 0a + ---+ $b = yi. 

75 : 6A +bfi + Pi+ 爲 + •••+ 成=抵 

r« : bfi 

0 i : a “+ fi+ 九 
(02 : o / i + •?!+ fa 


Wa+ 4l + A + '••+ 0b = Va. (4.18) 

■ ^» + o4i =y.i 

■ 乎。 +Oft =«3 


0h : a/i+ -fi + f 2 + • • ■ + f a + a$t = y.b 

注意到在 （4.18) 式中，将第 2 个到第 ( o + l ) 个方程加起来，就是第一个方程.而将其后的 
6 个方程加起来，也是第一个 方程. 这样一来，在这些正规方程组中,有两个方程和其他方程线性 
相关.这就是说，要解方程 (4.18), 必须添加两个约束.通常的约束是 

£ f<==0 » 矣“。 (4.19) 

使用这些约束，正规方程组就简单得 多了. 亊实上，方程组将变为 

bfi + bri = yi „ * = 1,2, -- ,o (4.20) 

afi + aPj = V.j, j = l,2, ••- ,b 

其解是 

n = Vi. -V.., i = 1,2 , …， a (4.21) 

Pi=V.i-y.., J = 1，2，...，6 

用 (4.21) 式的正规方程的解，得出的估计即拟合值为 

= A + fj + 4 # = ».. + (Vt. - V..) + (V.j - V. ) = Vi. + V.i - V.. 

这一结果在前面计算随机化区组设计中的残差时就已经在 (4.13) 式中用过. 

-般回归的显著性检法可以用来进行_化完全区職计的方差分析用由（ 421 )式给 
出的正规方程组的解，拟合全横型的简化平方和是 





































































考虑一个 P X P 拉丁方，在其上叠加第2个 p x p 拉丁方,其处理用希腊字母 表示. 如果在 
叠加时使每个希腊字母与拉丁字母一起出现一次且仅有一次,則称两个拉丁方是正交的,所得的 





































方差分析如表 4.23 所示•因为 p 值较小，所以结论是，所用的催化 



如果所研伽肝賴細，断《■个处簡紐碰缺赫測.娜賴 JE 交对照的 
则这些对照-定是由已调整的处理总和即似 } 而不是由 { 趴 } 所得出对照平方和是 



其中⑹ mmmm. 其働纽比较法晌 m 縣 it 较贿 e 娜过的处理均值对，在 442 
节中我们会见到它可以用 r^kQ.KXa) 来 估计. 己调整的处理效应的标准误是 


上述分析中，我鑛齡竹和鑛为師_处野紳、未棚的隨平方卿及误差 
平方和•有时，我们想要评估区组效应， 要做到这一点，韆要 SS T 的另-分解式，那就是 






有许多计算机软件包可以进行平衡不完全区组设计的 分析. SAS 的一 般线性模型方法是其 
中之一，另外一种是 Minitab , 它是 PC 广泛使用的统计软件包.表 4.25 的上半部是例 4.5 的 








考虑估计平衡不完全区组模型的处理效应.最小二乘正规方程组是 
n : Nii + r J^fi + k = y.. 

Ti : rfi + rfi + = y t . i = 1,2,••• ,o (4.35) 

0j :* A+ H ntjfi + = y.j j — 1,2, ■■■ ,a 

添加约束乙为 =J： 爲 = 0,可得 /i = P. .•用{^}的方程组消去 { tv } 的方程组中的区组效应， 


注意 (4.36) 式的右端项就是 kQi , 其中必是第 i 种己调整的处理总和【见 （4.29) 式].因为当 
Z nijnpj = A 以及必 =(因为 〜= 0或1)，所以可将 (4.36) 式改写为 

r(*-l)f<-A f； ^ = *<3* *= 1,2, ••- ,o (4.37) 

最后，注意到约束 _ f t = 0 獲含着 p f P = -fi , 又因 r(*j -l) = A(a-l), 故可得出 

Aafj = kQi i = 1,2, - - ,a (4.38) 

因此，平衡不完全区组模型的处理效应的最小二乘估计量是 

Ti = ^ i = l，2, …， a (4.39) 

例如，考虑例 4.5 的平衡不完全区组设计.因为（^ = -9/3, Q 2 = -7/3, Q a = -4/3, 
Qa = 20/3,得 

f4 = 徽 = 20/8 


与 4.4.1 节所得的相同. 

4.4.3 BIBD 中内部傕悤的恢复 

在 4.4.1 节给出的平衡不完全区组设计的分析通常叫做区组内分析 (intrablock analysis), 
了区组差异,所以，处理效应的全部对照都可以表示为同一区组内的观测值之间的比 
卜析对于固定区组以及随机区组都 适用. Yates(1940) 提到，当区组效应是均值为零、 
方差为的不相关随机变量时，可以得出关于处理效应 T, 的附加信息. Yates 称获得这类附加 
信息的方法为区组间分析 （interblock analysis). 







得出什么结论？ 

4.4 对思考题 4.2 中每种洗涤液的平均细茴置绘图，并与适当尺度的 t 分布进行 比较. 你得出什么结论 
*4.5 赖节巾描肋财■魏.赖魏細 if 脑断， 町 — 氏财 C 标尺下 的糊 （臧 



(a) 分析该实 舱中的 数据. 

(b) 用 Fisher LSD 方法作4个压头间的比较，确认囑个压头的硬度读数均值有显著不同. 















































*4_32 对思考埋 4.31 中的数据构造正交对照. 












第 5 章析因设计导引 



假定在二因子模型中没有交互作用 


5.5 拟合响应曲线与曲面 
5.6 析因设计中的区组化 
第5章补充材料 

S5.1 二因子析因设计中的期塱均方 
S5.2 交互作用的定义 
S5.3 二因子析因设计模型中的可估函 
S5.4 二因子析因设计中的回归模型方 
S5.5 模型的分层 


5.1 基本定义与原理 

很多实 验挪倾 个或乡个肝總应.-舰, #rH«it(factorial design) 对这类实验是 
最有效的.所谓析因设计是指，在这类实验的每一次完全试發或每一次重复中，这些因子水平的 
所有可能的组合都被研究到 •例 如，当因子 A ^ a 个水平和因子 b 有 6 个水平时，则每次重复 
都包含全体06个处理组合.当这些因子被安排在某一析因设计中时,常称为是交叉的. 

一个因子的效应定义为当这一因子的水平改变时所产生响应的变化这种效应常称为主效 
® (maiD eff6Ct )， 因为它来自实验中所感兴趣的基本因子•例如，考虑图 5.1 的简单实验.这是 
—因子 二 水平的析因 实验. 我们称这些水平为“低”和“ 高”， 分别记为“_，，和“+，，•该二水平 
的低水平的平 r 


设计中，因子 x 的主效应可看作为 . 


4的高水平的平均响应之间的差. 


. 40 + 52 20 + 30 

=就是说，因子>1从低水平增至高水平使得其平均_应增加了 21 个单位.类似地， s 的主效应 
b= 30 + 52 _20|40 = u 

^这些因子多預个料时，雜姑上财法， S 为有期5拭棘 翊子酸 应.这 —点随 
后进行更全面的讨论. 

在-些实验中，我们会发现，-个因子的水平间的响应差随其他因子的水平不同而不同当 
这种情况出现时，因子之间就存在交互作用 (interaction). 例如，考虑图5_2的数据 .. 对因子 B 
的低水平（即 B-), >1的效应是 









而对 B 的髙水平（即 B + ),A 的效应是 


>1 = 12 - 40 = -28 

因为>1的效应依赖于因子 B 所选的水平,可见>1与 B 之间存在交互 作用. 交互作用的大小是 
这两个4效应的平均差，即 /IS = (-28 - 30)/2 = -29. 显然，在该实验中这个交互作用是比 
较大的. 


«(+) 


*(-) 






低㈠ #(+) 

因子4 

二因子析因实验，其响应 （j/> 
a 示在各角点上 


低㈠ 高 (+> 

B 子>1 

围 5.2 有交互作用的二因子析因实驗 


这些想法可用图解来说明•图 5.3 是图 5.1 的响应数据图，是因子4对因子 B 的各水平 
的 . 直线与 B+ 直线几乎平行，表明因子 A 与 B 之间没有交互作用.相似地，图 5.4 是图 
5.2 的响应数据图.由图看出，直线与 S+ 直线不平行，表明因子 A 与 B 之间有交互作用. 
这样的图形在解释显著性交互作用和报告结果给未受过专门统计培训的管理者方面常常很有用. 
不过，这不可以用作为数据分析的唯一方法，因为它的解释是主观的，它的表面现象常常会令人 
误解. 



图 5.3 无交互作用的析因实驗 


图 5.4 有交互作用的析因实验 


其中， y 是响应，卢是待定参数，变量 n 表示因子牵变量 x 2 表示因子 B, e 是随机误差项.变 
置： r! 和奶用-1到+1的规范化定义 （4 与 S 的低水平和高水平)，幻勿表示: r , 和幻间 
的交互 作用. 







































IMj ^fl + Ti+0j + (T0)ij 

我们也可以用 5.1 节中的回归横型.回归棋型对实验中有~个或多个定量因子时特别有用.本 
章主要利用效应模型【(5.1)式】， 5.5 节中用回归模型. 

二因子析因设计中，行因子X与列因子丑(或处理）同样重要.具体来说，我们想要检验行 








y...^tttyak v：. = ^ 


总校正平方和可写为 

_ e __) 2 = 孟 孟孟你 • -卜） 

+ (9a. - Vi： - y.j. + V...) + (yak - yij.)] a 

= 6n E (H) a + «njC(5.j. ~v.,.) a 



+ ££孟 (物 * ， )a ( 5 . 4 ) 

这是因为右边 6 项交叉乘积 为零. 我们注童到，总平方和己分解为“行”即因子乂的平方和 
(5氏0, “列”即因子 S 的平方和 (SS B ), 4 与丑 间的交互作用的平方和 (SS AB ), 以及起因于 
误差的平方和 (SS E ). 这是二因子析因设计的基本 ANOVA 等式，由 （5.4) 式右端项最后的分 
童可以看出，要得出误差平方和至少要有两次重复 （„ >2). 

用符号记 （5.4) 式为 

SSt = SSa + SSb + SSab + SSe (5.5) 

各个平方和的自由度是 






对平方和的 afrn - 1个总的自由度的分 E, 验证 如下： 主效应X 与主效应 B 分别有 a 个水平与 
b 个水平，因此，它们有 a _ 1个自由度与6 - 1个自 由度； 交互作用的自由度是单元的自由度 
(为— 1) 减去两个主效应4与 B 的自由度，即 afc _ 1 _ (a _ 1) _ - 1) = ( a - 1)(6 - 1); 

在 afc 个单元的每一单元内， n 次重复间有1个自由度，于是，有 afr(n-l) 个误差自由度. 
(5.5) 式右端项的自由度加起来就是总的自由度. 



E 陶 =E (告卜 > +宴 
華 ㈣ 尚=，+ 


E ( MS -)= E (s^n)=^ 

如果没有行处理效应、没有列处理效应以及没有交互作用的零假设为真，则、 MS S 、 MS AB 
与 MS e 都估计了然而，比方说，只要行处理效应之间有差异，则将大于 AfS E .同 
理，当有列处理效应或出现交互作用时，则对应的均方将大于 Af5 E _ 因此,为了检»主效应与交 
互作用的显著性，将对应的均方除以误差均方.这个比值较大表示所得的数据不支持零假设_ 

如果模型[(5_1)式1是合 适的， 误差项服从正态独立分布且有常值方差则均方的 
每一比值 MS A /MS B , MSs /M5 b 以及 MS AB /MS B 都服从 F 分布，其分子的自由度分别 
是 a - 1、6 - 1与 （ a — 1)(6 — 1), 分母的自由度是 a fr( n — 1)®, 而临界区域就是 F 分布的上尾 
部,检验方法通常概括在一张方差分析表中，如表 5 .3所示. 

我们一般都用统计软件包进行方差分析计算.但是,也可直接手工计算 (5 . 5) 式中的平方和. 
可以将方差分析恒等式中的每一元素写成 

Vak - y... = (yt.. - »...) + (y.i. - y...) + (m - yt.. - y.j.+y...) + (y iJk - ffu.) 

并在工作表的列中计算 它们. 然后对每列平方并求和得到 ANOVA 的平方和.也可以利用基于 
行、列以及单元和的计算 公式. 总的平方和通常由 




(5.6) 











































(5.1 5 a) 式与 (5.15b) 式构成两个约束，而 （5J5c) 式与 (5.15d) 式妝 
因此，总共有 a + 6+1个约束，恰是所需的数目. 

应用这些约束，还大大简化了正规方程组 [(5.14) 式 j, 求得解为 


正规方程组的这-解有很直观的 意义. 行处理效应估计为行平均减去总平均，列处理效应估计为 
总平均， D 个奴作触计诚 , 》个单涵平城絲平均、第 》• 个行效应和第 

用（ 5 .16)式, 可求得叫 k 的拟合值为 






注意到 n= 4 次重复时，得出的风险/3约为 0.06. 或者说，对应于任意两种温度水平，电池 
寿命的均值差大到40小时的话,則以大约94%的机会拒绝零假设.这样一来,结论是,只要我们 
对电池寿命的标准差的估计出入不太大，那么做4次重复足以达到所要求的灵敏度.如果拿不准 
的话，实验者可以用其他的值来重复上述程序，以便确定错估该参数对设计的灵敏度的 影响. 
5.3.6 假定在二因子横型中没有交互作用 






{ * = 1,2, -- ,n 

但是我们必须对在棋型中舍弃交互作用项抱十分谨慎的态度，因为显著的交互作用的实际存在 
会对数据的解释产生极大的冲击. 

无交互作用的二因子析因模型的统计分析是简单的.用无交互作用模型 [(5.20) 式I对例 5.1 
的电池寿命数据所作的分析见表 5.8. 与先前的分析一样，两个主效应是显著的.然而， 一 旦对这 
些数据进行残差分析，就立即看出，无交互作用棋型是不合适的 • 对无交互作用的二因子棋型来 
说，拟合值是如 * =识..+ h — 钇..•知.-如(单元平均值减该单元的拟 合值） 与拟合值心 fc 
的关系图如图 5.15 所示.现在，量 H ik 可看 作为： 在无交互作用的假定下,被观测的单元 
，值与该单元的均值估计 之差. 这些量的任何特定的模式都暗示着交互作用的存在.图 5 . 15 显 
示了一种明显的模式， 因为 M 恥. -y iik 从正到负再到正再到负.这种结构是材料类型与湯度之 
间交互作用的结果. 



有时，人们会遇到只做一次重复的二因子实验，也就是说，每单元只有一个观 测值. 如果有 
两个因子且每单元只有一个观测值，则效应模型是 


yii-t* + r i +0 i + (T0) ij + eij | : 二 ^:::’: （ 5.21) 

假设两个因子固定，此时的方差分析如表 5.9 所示. 
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方絲涯 __ 自由度 均 方 期望均方 

行 M) E 4-^ «-1 ms a ^ + ^ 


在碥定交互作用是否存在方面，可以使用 -nikey(1949a) 提出的检《法.此法假定交互作用 
项以特别简单的形式出现，即 

( T P)*i = ITipj 




























SS ^ = 忐孟 A - & = i|(26)» + (49)>]-^ =22.042 


表 5.13 例 5.3 的罐装离度偏差数据 
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要计算二因子交互作用的平方和，必须求出双向单元的总和.例如，为了求碳酸-压强即的交互作 
用，需要表 5.13 中 A x B 的单元总和 { Wi ..} •用 （5.31) 式,求得平方和为 

=&(-5> 2 + ⑴ 2 + w a + (16) 2 + (22) 2 + (37) 2 ]- i ^ 

- 252.750 - 45.375 = 5.250 

碳酸-速度即 4 C 7 的交互作用由表5_13所示的 AxC 的单元总和 { y < fc .} 以及 (5.32) 式求得 

SSAC= k&A vh -&r SSA - SSc 

= J [(-5 ) a + ( l) a + (6 ) a + (14) 2 + (26) 2 + (34) 2 ] - ® 

- 252.750 - 22.042 = 0.583 

压强-速度即的交互作用由表 5.13 的 fi x C 的单元总和{心“以及 (5.33) 式 求得： 

ss •。-- SSc 

=^[(6) 2 + (15 ) a + (20)*4 - (34) 2 ] - 45.375 - 22.042 = 1.042 
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如果析因实验中的几个因子是定量的，响应曲面也许可用于模拟和设计因子的关系，而且 
定置因子效应可表示为单自由度的多项式效应•类似地，可将定量因子的交互作用分解为单 
变的交互作用分置.下述例子说明这 一点. 













































代表如下的 3x2 析因处理组合： 4 = / lSl , S =厶佴， C = A 卯， 

个自由度对应于滤波器型号 （1 个自由度)、地面杂乱回波 （2 个自由 
(2 个自由度）的主效应.该设计的线性统计横型为 



S.21 用 6x6 拉丁方进行的霄达探 * 实验 






分析这些数据并写 
作出适当的残差图 
法什 么*#下运 






























































6.2 2 2 设计 173 


B 的平均主效应由 S 在>1的低水平上的效应（即， (6-(l)]/n) 和 B 在 A 的高水平上的 
效应（即，求得: 

B = ^{[ot -a] + \b-(l)]} = ^[o6 + fr-o-(l)] (6.2) 

交互作用效应 AS 定义为在 B 的高水平上的效应与>1在 B 的低水平上的效应之差的 
平均值.于是得 

AB =^{[06-6]-[o-(l)]} = ^(a6+(l)-a-6] (6.3) 

也可以定义为 B 在>1的高水平上的效应和 B 在4的低水平上的效应之差的平均值.这 
样定义也可以得出 （6.3) 式. 

A t B, AB 的效应的计算公式也可以用另一方法推导出来 .A 的效应可以由田 6.1 中的正 
方形右边的两个处理组合的平均响应（称之为平均值 y A+ , 因为它是在 >4的离水平处的处理组 
合的平均晌应）和左边的两个处理组合的平均响应（即 y A .) 的差而求得.也就是说， 

a=Va+ -- = ^T~ ^ = 

这和 （6.1) 式的结果完全相同， S 的效应，即 （6.2) 式,可以由正方形上方两个处理组合的平均 
值 (y B+ ) 和正方形下方两个处理组合的平均值 (§ B -) 的差而求得，即 

B = !?b+ ~5b- = £ ^- £： ^ = ^[a6 + 6-a-(l)] 

最后，交互作用效应 AS 是正方形右至左对角线上的处理组合 [afc 与 （I” 的平均值减去左至右 
对角线上的处理组合 （ a 与 6) 的平均值，即 

AB = g fc +JO _ = i-[a6 + (1) - a - 6] 

这与 (6.3) 式相同. 

用图 6.1 的数据，估计平均效应为 

>4= ^(90 + 100 - 60 - 80) = 8.33 
B = 2^J (90 + 60 - 100 - 80) = -5.00 
AB= 2^ j (90 + 80-100 - 60) = 1.67 

A 的效应（反应物浓度）是正的，这表明它是递增的.欠从低水平(15%)增至 ft 水平（25%)将 

增加产率 • B 的效应（催化剂）是负的，这表明在生产过程中增加催化剂的量会降低产率.相对 

于两个主效应说来,交互作用效应显得较小. 

在很多涉及沪设计的实验中，我们将考察因子效应的大小 (magnitude) 和方向 (direction), 
以便确定哪些变量可能是重要的.方差分析一般可用来证明这一点.在建立和分析 2* 设计的过 

程中，有一些非常优秀的统计软件包很有用•同时,也有一些特殊的简便方法用来计算方差分析. 






































此式也可以用图 6.5a 的立方体右边一面的4个处理组合（其中>1处于高水平）和左边一 
面的4个处理组合（其中处于低水平）之间的对照推导出来.也就是说，4效应恰好是4处 
于高水平时4个试验的平均值沒4 + )减去4处于低水平时4个试验的平均值即 


_ a + a6 + ac + abc (1) + 6 + c + 6c 
A = 9a+ - Va -= - - - — — 

此式可以重新排为 

A = ^[a + o6 + ac + o6c- (1) - 6-c-6c] 

它与 (6.11) 式相同 • 

同理， B 的效应是立方体前边一面的4个处理组合的平均值和后边一面的4个处理组合的 
平均值之差，即 


B — y B + - y B - = ^[fc + a6 + 6c + o6c — (1) - a - c — ac] (6.12) 

C 的效应是立方体上边 一面的 4 个处理组合的平均值和下边一面的 4 个处理组合的平均值之 
差，即 

C = y c + -y c - = ^[c + oc + 6c + a*c- (l)-a-6-a6] (6.13) 



mmm 

(i>) 二 H 子交互作用 



(* ) 三因子交互作用 




圈 6.5 2 3 设计中对应于主效应和交互作用的对照的几何表示 


二因子交互作用效应容易计算出来 . 交互作用的一种度量是X在 B 的两个水平上的 
平均效应 之差. 为方便起见，称此差的一半为交互作用.用符号表示为， 




_ q&c + a6 + c + (l) _ ftc + & + oe + o 

从这种形式容易看出，交互作用就是图 6.5b 的立方体中在两个对角面上的试验的平均值之 
差.同理并参考图 6.5b , 得和交互作用分别是 


A< ^ = ^[(1) -o + 6- ai>-c + ac-6c + a6c] (6.15) 

+ a-b-ab-c-ac + bc + abc] (6.16) 

ABC 交互作用定义为在 C 的两个不同水平上的交互作用之差的平均值.于是， 
ABC= ^{(aftc-6cj - [ac-c]-[ab - 6] + [a-(!)]> 


c-a6 + 6 + a-(l)] 


(6.17) 


目看作为两个平均值之差 _ 如果把两个平均值中的试验分离 
:方体中的两个四面体的顶点. 

括号中的量是处理组合的 对照. 一张加减符号表可以从这些 


如果把两个平均值中《 

为两组，那么，它们就是图 6.5c 的立方体 

在（ 6 .11)式至 (6.17) 式中 ，： 

对照中导出来，如表 6.3 所示. 主效应的符号是：高水平取加号，低水平取 减号.一 旦主效应的符 
号确定，其余各列的符号可以逐行地用前面恰当的列的符号相乘而得•例如，仙列的符号就是 
A 列的符号与 S 列的符号*行的 乘积. 任一效应的对照容易由此表求得. 

_ 表 6.3 it* 2^设计的效应的代败符号 

















— 一 一- • v - j xia ；3 * KV .7 Ss JVJ tfJX 及作用.戏差田观 »| 得到的 

蚀刻率和预测蚀刻率之间的差来 求得. 我们把这些残差的分析作为练习留给 读者. 

图 6.7 给出了从回归模型得到的蚀刻率的响应曲面和等高 线图. 因为模型含有交互作用，蚀 
刻率的等高线是曲线（响应曲面是“扭曲的”平面).理想的工序要求蚀刻率接近咖又知•等 
高线图表類咖神的几顿合獅I跋个目标 . 但是，_馳雛些效是有必要的. 











括，模型的平方和为 

5S«« = SS A + SS b + SS c + SSab + SSac + SS B c + SSabc = 5.134 x 10 6 

用于检舱假设 

Ho ： 01= Pa = 03= 0}2 = /?13 = /?23 = /Jl23 = 0 
:至少有一个 /?〆(） 

因为 Fo 大,我们得出 结论： 至少一个变量有非零效应.用 F 统计量检验每一个析因设计效应的 
显著性.其结果与表 6.6 —致. 



表 6.7 中全棋型方差分析的下面，列出了几个 fl 2 统计量.普通 的炉为 

fi2 = fl5 = 5^14 xlO» = 0 9661 

它度量了由棋型解释的总变异性的比例.该统计童的一个问题是它随着模型因子个数的增加而 
增加，即使这些因子是不显 著的. 己蜩整的 il 2 统计置，定义为 

小^* = 0編 

它是根据模型的“大小”(即因子个数）调整的统计置.如果模型中增加不显著项，己调整炉的实 
际上会随之降低. PRESS 统计量是衡量模型預测新数据精确程度的 指标. (PRESS 是 Prediction 
Error Sum of Square 的 缩写. 通过用除第 < 个以外，其他观测值都在内的模型来预测第 i 个数 




























这也是方差分析中的用误差均方给出的方差估计.每一效应的方羞估计是 

哺应卜彳黑卜^打对照） 

每一对照是 2* 个处理总和的线性组合,而每一总和是由„个观测值构成的.因此， 

V(对照 ) = 2*W 2 

且一效应的方差是 

将《7 2 代以它的估计量 <S 2 并取最后表达式的平方根就可求得标准误的 估计： 

此(效应 ) =盖 （6.20) 

注意到， 2*= 设计中，效应的标准误是回归祺型中回归系数估计量的标准误的 2 倍.（见例 6 .i 
的 Design-Expert 计算机输出). 

用效应 ±t a/2 , N _ p se(»m) 计算效应的 100(1 - «)%置信区间，其中*的自由度是误差或 
残差的自由度 （AT - P = 试验总数_模型参数的个数). 

为说明这一方法， 考忠例 6.1 的晶片蚀刻实验.全模 S 的均方误是 MS b =2 252.56, 每一效 
应的标准误是（用 5 s = MS e ) 

從 _ = ^ = : 23 . 73 

，时， <0.025,8 = 2.31, *0.025, 衫 e (效应 )= 2.31(23.73) = 54.82, 于是，各因子效应的近似95%置 














尽管前面叙述的计算大多数可以利用计算机进行，但有时手工计】 
和也是必 要的. 要估计一个效应或计算一个效应的平方和，必须先确定 
如表 6.2 或表 6.3 那样的加号和减号表做到这一点.不过,对大的 A 存 
其他 方法. 一般说来，确定效应 ASA •的对照可以用展开下式右边 | 










































分析 显露出 的重要效应是主效应 災， C7, Z) 以及 AC 交互作用和 /ID 交互作用_ 



















































































表 6.15 列出了 2 4 设计的完全对照集以及在例 6.4 嵌板实验中的每个残差.此表的每一列 
含有相等个数的加号和减号，因此可对各列的每组符号算出残差的标准差，即 5(i + ) 和 5(*-), 
» = 1,2,- -,15.于是 

K j < = 1,2, - - ,15 (6.25) 

是一统计童,可用来判断实验分散效应的 大小. 如果因子 i 为正时试竣残差的方差等于因子 i 为 
负时试验残差的方差，則 fT 近似服从标准正态分布 • 的值列于表 6.15 每列的下面. 

_ 表 6.15 m 6.4 _ 

试 Ife A B AB C AC BC ABC D AD BD ABD CD ACD BCD ABCD 




S(t+) 2.25 2.72 2.21 1.91 1.81 1.80 1.80 2.24 2.052.28 1.97 1.93 1.82 2.09 1.61 
5(*-) 1.85 0.831.86 2.20 2.24 2.26 2.241.551.931.61 2.11 1.58 2.16 1.89 2.33 

F i 0.39 2.37 0.34 -0.28 -0.43 -0.46 -0.44 0.74 0.12 0.70 -0.14 0.40 -0.70 0.20 -0.74 

图 6.28 是分散效应的标准正态分布图•显然，丑是有关生产过程分散性的一个重要因 
子.这个方法的进一步讨论见 Box and Meyer(1986) 以及 Myers and Montgomery(2002) •为 
了使麵随錄全_达关于分雜信息,位 S_^i£ 确馳定.本章的补充材料提 






















































可用来对弯曲性进行检验.更具体地，当加进的点是 2 *设计的中心时，则 [由 （e.28) 式] 弯 

















(1) 当析因实验在一个正在运行的过程中进行时，考虑使用目前的运行条件（或配方）作为 
设计的中心点.这通常确保实舱中的部分搡作人员能在熟悉的条件下完成任务,所以得到的结果 
(至少是这些试验）不会比现在的结论差. 


(2) 当析因实16中的中心点对应于通常的运行配方时，实驗者可以利用中心点的鸸应观测值 




机的和无机的)•图 6.37 显示了这些因子的2 3 设计. 注意到中心点被放在^含定性因子的立方 
体的对面.购職， _ r 贼些抒贿包 含定: *因子，帖賴卿找雖性肝的高水平 
和低水平的处理组合上进行试验. 



围 6.37 含有一 定性因子和中心点的2 3 析因设计 


6.7 使用规范化设计变置的理由 

读者己注賴，在林巾， 細在断 ㈣ ■ 2 fc 析 SSi+ 卿雖 合时概 用了航 设计变 
置， - 1 <而< +1，而不是来用按它们琢始单位（有时称实际、自然或工程 单位） 的设计因子 
若采用 IS 单位，与雛靴分 析舭, 射 ] 赌 ffl 不_難關， it 賴个縣不容易解释 





























取适当尺度的 t 分布，画出思考邐 6.1 中因子效应的图形.从图中能恰当地识别出重要的因 子吗？ 
将由图中所得的结论与由方差分析所得的结论进行比较. 

有一台用来在印刷电路板上刻癀的刻 纹机. 刻划时在电路板表面上的摆动水平可以看作为刻 癟空间 
位置摆动的主要来源.考进影喃播动的两个 因子： 刀刃尺寸 （4) 和刻划速度 （S). 选择两种刀刃尺 

































































































第 7 章2-析因实验的区组设计和混区设计 



































L = + 02X2 + ■ •• + a k Xk (7.1) 

其中 A 是 一# 定处理组合中第 i 个因子的水平， a< 是第 i 个因子在被相混的效应中的分量.对 
2 *系统说来，有你= 0或1，而= 0( 低水平）或 x< = 1( 离水平) •（7.1) 式称为定义对照•产生 
相同 L 值 （mod 2) 的处理组合放在同一区组内•因为I的值 （ mod 2) 只可能是0和1，这就 
把妒 个处理组合准确地分在两个区组中. 

为了说明这一方法，考虑 ABC 与区组相混的2 3 设计.此时，幻对应于 A, 勿对应 S, 吻 
对应子 C, 以及 or x = a 2 = « 3 = 1. 于是，对应于 ABC 的定义对照是 


处理组合⑴在 （0, 1) 记号法中写为000,因此 

£ = 1(0)+ 1(0)+ 1(0) = 0 = 0(mod 2) 

类似地,处理组合 a 是100,得 

i = 1(1) +1 ⑼ + 1⑼=1 = l(mod 2) 
于是 （1) 和 a 将在不同的区组中进行试验.对其余的处理组合，我们有 
=1 = l(mod2) 
= 2 = 0(mod 2) 
=1 = l(mod2) 
= 2 = 0(mod2) 
(1) = 2 = 0(mod 2) 
(1) = 3 = l(mod2) 


fl，fc， C ，a6c 分在区组 2. 这与由加减符号表所得的图 7 .2 


这样， （1), a6,ac,6c 分在区组1,而 a , 

所示的设计相同. 

也可以使用另-种方法构造这些设计.包含处理组合⑴的区组叫做主区组 (principal block) . 
在此区组 rt 的处龍合具有-个賴_论膝, W* &们关于 3H 糊 | 2构成_是说，主 


















































图 7.5 是修改过的实验中因子效应的正态概 率图. 尽管该图表面上与第 6 章给出的实验的 
最初分析没有太多的不一致（见图 6.11), 但重要的交互作用之一，并没有识别出来 •结果 
我们不能发现作为解决最初问题的关键之一的这个重要 效应. 回頋第 4 章,我们称区组化是嗓声 
缩减 技术. 如果不能区组化，由讨厌变量效应增加的变异就分布在其他设计因子中 • 



它比基于原始数据的残差均方大了好几倍 （见表 6.13). 






















7.9 列出了有用的 设计. 为说明此表的用法,假定我们要构造沪= 8 个区组中的2 8 混区设计， 
每个区组有2 3 = 8个试验■表 7.9 指出，我们可选取 ABEF, 和 ACE 作为 p = 3个 

独立的效应来生成 区组. 其余的 2 p - p - l =2 3 -3- l =4 个与区组相混的效应是这3个效 
应的广义交互 作用； 也就是’ 

(ABEF)(ABCD)= A 7 B 7 CDEF = CDEF 
(ABEF)(ACE)= A 2 BCE 2 F = BCF 
(ABCD)(ACE)= A 2 BC 3 ED = BDE 
(ABEF){ABCD)(ACE)= A 3 B 2 C 2 DE 2 F = ADF 


在思考题 7.11 中要求读者生成此设计的 8 个区组. 







































复中的败据.设这些观测值不 
计，每个区组有4个观测值，, 
复中的数据.构造一个混杂 A 


*7.1 考虑思考應 6.1 中描述的实驗.分析这个实驗，«定每》 

7.2 考虑思考题 6.5 中描述的实 》• 分析这个实«设4次重复中的毎一次都 f 
7.3 考虑思考题 6.15 推述的合金裂缝试验.毅定一天仅作16试每次重复作， 

实酱并得出结论. 

•7.4 考虑思考题 6.1 第一次重复中的数据. 

建立有两个区组的混区设计， 

7.5 考虑思考题 6.7 J 

个观测值.分析这_ 

7.6 思考题7_5中改为 惺定* 用4个 区组. >1S£> 和 ABC(JAM CD ) 与区组 灌杂. 

•7.7 用思考题 6.24 中2 5 设计的 数据. 构造并分析二区组中的《区设计，其中， ABCL 
•7.8 思考题 7.7 中改为霱用4个区组.提出一个合理的《区方案 • 

•7_9考虑思考题 6.24 中的沪设计的数据.假定*用混杂 ACDF 和 SCD (从而 ABE ) t 
灌区 设计. 分析此设计所得的败据. 

•7.10 考虑思考厘 6.18 的灌装高度偏差实假定一天只篇进行一次重复.假设工作日为区组，分析数据. 
711 考虑思考题㈣的灌装高度偏差实故假定每个班次只能做 4 次縱.粒-个设计，使得仙 C 
混杂在重复1中， /1C 混杂在重复2中.分析数据并论述你的发现. 

•7.12 考舰賴 6.19 _尔夫实考触;触 M 作旭I分析数据. 

7_13考虑思考题6_20的2 4 设计数据，构建并分析 ABCD 与区组灌杂的二区组的设计. 

7.14 考虑思考题 6.22 的直接邮递 试驗， fi 定毎组®客来自城镇的不同 地方. 建议该实验的一个合理分 

7.15 设计一个四区组中的2« «区设计，提议一个与表 7 . 8 不同的灌区方案. 

5 2 * 每卞区 •组5 8 次试故选取 abcd . ace.abef 作为与区 



--- - -•—设计.找出其他与区组相混的效应 • 

7 考虑混杂 AB 的二区组沪 设计. 用代数方法证明 SSab - 

8考虑例 7.2 的数据.设区组 2 内所有的 观测值 都增加 20 . i 


例 7.2 的数据.设 

大小你能解释吗？ 

响吗？ 

-—思考雇 6.1 中，重夭》,*累乃如,里 j 
写出方差分析表. 

3飯定在毎次重复中 ABC 与区组相混，重复 
1设在思考 • 6.7 中，重复I中灌杂 ABCD , 


重复 H * 杂重复 III ft 杂 SC . 计算因子效应估计， 












:水平分式析因设计 




F 集组成的设计 
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(3) 序赏 实雄. 可以将两个（或多个）分式析因设计序贯地组合成一个设计,用来估计所感 
兴趣的因子效应和交互作用. 

本章将主要讨论这些原理并用几个例子来加以说明. 









2 3 - 1 设计处理组合有 3 个自由度，可用来估计主效应.根据表 8.1, 用来估计 A，B，C 主效 
应的观测值的线性组合是 

[4] = |(o - 6 -c + abc), [B] = + & - c + obc), [C\ = |(-a-6 + c + ai»c) 

其中记号⑷，问， [C] 是用来标记与主效应相关的线性组合 •容易证明： 用于估计二因子交互作 
用的观测值的线性组合是 

[BC\ — ^(o — b — c + abc), [AC\ — ^(—a+b — c + abc), [ABj = $(-a — 6 + c + afic) 
于是，㈧ = [BC\,[B\ = [AC\, [C\ = [AB], 因此，不可能区别 A 和和 AC,<7 和 AB. 
事实上，当我们估计 A, B, <7时，实际上是估计 A + BC,B + AC,C + AB. 具有这一性质的两 
个或多个效应叫做别名 (alias). 在我们的例子中，4和 SC 是别名， S 和 AC 是别名， C 和 
是 别名. 用符号记为 [A)^A + BC, [B\^B + AC, [C\^C + AB. 

此设计的别名结构很容易用定义关系/ = ABC 来确定.任一列（或效应）乘以定义关系就 
得出那一列（或效应）的 别名. 在我们的例子中，如>1的别名可以这样 得出： 

A I = A- ABC = A a BC 
因为任一列的平方恰是单位/，所以 

A = BC 

同理，求得 S 和 C 的别名分别为 

B I = B- ABC, B = AB 2 C = AC 

以及 

CI = CABC, C = ABC 2 = AB 
具有 J = +X 执 7 的 1/2 分式，通常叫做主分式 （principal fraction). 

现在假定我们选取了另一个1/2分式，即，表 8.1 中 ABC 列取减号的那些处理组合.这一 

备选的 （alternate) 或互补的 (complementary) 1/2分式设计（由试验⑴， o6,oc,6c 组成）如图 



观测值的线性组合，即 [AW^WC]', 由备选分式设计 给出： 

[A]' ^ A-BC, [B)'^B~AC, [C\'^C-AB 

于是，当我们用这一指定的分式设计来估计 AS,C 时,实际上是估计 

在实践中，实际上用哪一分式设计是无关重 要的. 两个分式设计属于同一族 （family) ， 也就 
是说，两个1/2分式设计形成一个完全的2 3 析因设计.参考图 8.1 的 a 部分和&部分就容易看 
出这一点. 

假定做了一个2 3 析因设计的1/2分式设计的试验之后，另一个也做了.于是,所有与沪设 
计有关的8个试验现在都有了.现在，将这8个试验作为每区组有4个试16的二区组沪析因 
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设计来分析，就可求得所有效应的分离别名）的估计董.这一点，也可以利用两个分式设计所得 
的效应的线性组合相加或相减求得.例如，考虑 — X + SC 和 ^A-BC , 可得 

5«^] + = \(a + bc+a-bo^a 

- m = l(A + BC-A + BC)-*BC 

于是，对所有的3对线性组合，可以 求得： 



B B AC 

S _ £ _ AB 


8.2.2 设计分辨度 

前面的 2 3 _ i 设计叫做分辨度为 HI 的设计 (resolution III design ). 在这样的设计中，主效应 
的别名为二因子交互 作用. 一设计叫做分辨度为 i ? 的，若不存在 p 因子效应的别名为另一含有 
少于- p 个因子的效应.通常用罗马数字下标表示设计的分辨度，于是,有定义关系/ = 

(或 J = - ASC7) 的沪析因设计的1/2分式设计记为设计 • 

分辨度为 HUV , V 的设计特别 重要. 这些设计的定义及例子如下. 

(1) 分辨度为 m 的 设计. 其中主效应的别名不能为任一另外的主效应，但主效应的别名可以 
为二因子交互作用，而且一些二因子交互作用可相互为别名•表 8.1 的2 3 - 1 设计是分辨度为 m 
的设计 ( O . 
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据).因为渗透率的观测值与预测值非常接近，所以这是一个成功的确认实这也表明分式析 
因实验的觯释是正确的. 

有时一个确认试验的预测值与观测值并不是这么接近,这就有必要回答两个值是否足够接 
近,从而有理由认为分式设计的解释是正确的.回答这个问題的一种方 法是： 构造该确认试验的 
未来响应值的预瀏区间 (prediction interval ), 然后看实际观测值是否落在预测区间中.在 10.6 
节介绍回归模型的预测区间时,我们将用这个例子来说明这一点. 

8.3 2 fc 析因设计的1/4分式设计 


对中等大的因子个数，常用 2 fc 设计的较小的分式设计.考虑 2 fc 设计的1/4分式设计.此 
设计包含2* 1 - 2 个试验，通常叫做 2 fe - 3 分式析因设计. 

2 fc - a 设计的构造方法是，首先写出 fc _ 2个因子的完全析因设计的试验组成的基本设计，然 
后再加上两列，这两列由开头的 k -2 个因子的恰当交互作用组成的.这样一来，2*- 2 设计的 
1/4分式设计有两个生 成元. 如果 P 和 Q 代表选取的生成元，则，/ =尸和 J = Q 叫做此设 
计的生成关系 (generating relation ). P 和0的符号 （+ 或者-）决定了采用囑一种1/4分式 • 
与生 成元士 P 和士 Q 的选择有关的所有4个分式是同一族的 成员. />和0都是正的那个分式 
是主分式. 

所有等于单位列/的列组成设计的完全定义关系 •这由 P ， Q , 以及它们的广义交互作用 PQ 

所组成，也就是说，定义关系是 I = P = Q = PQ . 称元索 P ， Q，PQ 为定义关系询.任一效应 

的别名可由效应所在的列乘以定义关系的每个词而得.显然,每一效应有3个别名.实验者要谨 
慎地选择生成元以避免可能重要的效应相互为别名. 

/ = ABCE 和/ = BCDF 为设计的生成元.生成元 
广义交互作用是 ADEF , 因此，此设计的完全定义关系是 
= ABCE = BCDF = ADEF 


从而，此设计分辨度为 IV . 为求得任一效应（例如 >1) 的别名，将此效应与定义关系的每个词相 
乘即可•对于 X ,得 

A = BCE : ABCDF = DEF 


容易证明，每个主效应的别名是三因子交互作用和五因子交互作用，二因子交互作用的别名是 

另一个二因子交互作用或更高阶交互作用.于是，估计>1时，我们实际上是估计 A + BCE + 



要构造此设计，首先写出基本设计,它由以 A , B , C , D 为因子的完全2«- 2 = 2 4 设计的16 
个试验所组成.然后加上两个因子 E 和 F , 它们的水平分别由交互作用 火 SC 和 BCD 的加减 
符号所决定.此方法见表 8.9. 


构造此设计的另一方法是，先使 ABCS 和 BCDF 与区组相混，导出2«设计的4个区组， 
然后选取处理组合在 ABCE 和 BCDF 上都为正的区组.这就得出生成关系为 J = ABCE 和 

I = 的分式析因设计，因为生成元 XSC 五和 BCDF *是正的，这就是主 分式. 





























变量 

A 

C 

D 

E 

F 

名称 
成型温度 
蠊杆转速 
保持时间 
循环时间 
射 C3 大小 
保压压力 

-1 水平 
-1.000 

+1水平 

1.000 

总平均值 

A 

B 

C 

D 

AC+BE 

AD+EF 

AE + BC + DF 

BD + CF 

BF + CD 

ABD 

ABF 

27.312 5 

6.937 5 

-0.437 5 

0.687 5 

0.187 5 

0.187 5 

5.937 5 

-0.812 5 

-2.437 5 

0.625 0 
-0.125 0 

-0.125 0 

5 076.562 
















设计 >1 中的 3 个宇长都是4,即，字长横式为 {4,4,4} •设计 S 的是 {4,4,6] 
C 的是 {4,5,5}. 设计 C 只有一个4个字母长的宇，而其他设计有两个或三个 . m 
C 使得定义关系中长度最短的字的个数最少.我们称这种设计为最小低阶混杂设计“ 





























. 假定我们想把设计的试驗分为两个区组， 
:作用时，査一下附录表 X ( f ) 的别名结构， 















































8.5 分辨度为 m 的设计 


n* 贝 flats 用析凶坟计非常有用，通常能够大大节省实验费用和提高实骑 































都取原设计的相反符号.这种折叠（有时称为完全折叠，或反射）会打破主效应和二因子交互作 
用之间的别名联系.即，我们可以用组合的设计来估计与任何二因子交互作用脱离开来的所有主 


效应.下面的例子说明这一完全折叠方法. 










































































仍要注意，为了将试验次数从16次降为12次，实验者要将二因子交互作用的别名关系更 
加复杂化.相对于标准设计而言，在棋型系数估计的稍度方面也有损失. 

这些分辨度 IV 的最小设计是非正规分式析因设计的一些例子. Design - Expert 包含了因子 
个数5 < fc < 30的一系列这类设计.在主效应最受关注而二因子交互作用不能完全忽略的筛选 
问题中，这些设计是标准析因设计的非常有用的替代.若二因子交互作用是重要的，为了 
确定哪些交互作用是重要的，则必须追加实验. 

8 . 0.2 分辨度为 IV 的设计的序贯实验 

因为分辨度为 IV 的设计常用于筛选实验,在实施与分析了最初的实验后,经常需要用追加实 
验来完全分辨所有效应.我们在 8.5.2 节中讨论了分辨度为 III 的设计的情况,并引入了折叠作为 




效应是实际效应是合乎逻辑的.然而，关于 + 别名链的效应估计也偏大.除非还有其他 
工序知识或工程信息可提供，要不然我们不知道这究竞是交互作用效应 AByCB 还是两个都是. 
_袠 8.31 硅暴片光阻镀层实验頋先的 2 f v ^设计 


通过建立一个新的2^ 2 分式析因设计，并改变因子4的符号，可构造出一个折叠设计.加 
上了折叠试验后的完全设计被列在（按标准顺序）表 8.32 中. 可以看到试验分成两个区组，来自 
原先表 8.31 2^2设计的试验在区组丨中，折叠试验在区组 2 中.从组合试验得到的效应估计 
(忽略三因子交互作用或更多因子的交互作 用)： 

















图 8.25 表 8.31 中硅晶片光阻镀层实验原先的效应的半正志概率图 
容易证明，表 8.32 中的完全折叠设计可以估计前面列出的 6 个主效应和 W 个二因子交互 
作用别名链，奴期1 12个包締較 S 侧雖賴 应_钱.贼分狀雌生成元是 
E = 乂召^和 F = BCD , 因为我们改变了 >1列的符号来建立折叠设计,所以关于第二组16个 
试验生成元是£ = -ABC 和 F = BCD . 因为只有一个单词是一样的 （L = 1," = 1), 所以 
组合的设计只有一个生成元（它是一个1/2分式设计)，组合的设计的生成元是尸= BCD •而 
且，因为 ABCE 在区组1中为正，在区组2中为负，所以 ABCE 加上它的别名 ADEF »与 
区组混杂. 














































































































































8.9 思考超 293 













解释该实驗的结果，假定*要的*化层的厚度在140至160之间. 

I- Hare 的一篇文聿 （“In the Soup： A Case Study to Identity Cont 

ty ”，Journal of Quality Technology, Vol. 20, pp. 36~43) 里描述了 



r Technology, Vol. 20, pp. 36~43) 里#述了一个用于研究干汤料包的 

因 实驗. 因 子是： 4=蔬菜油的加料口个数 （1, 2), S= 混合物的环境温度 （冷， 
秒，80秒 D= 批的重置 （1 5001b, 2 000 lb), E = 混合与包装的间隔天 
小时内被抽 取的® 料包数量在125到150之间，《料包重量的标准 




取代改变列 A 的 i 
A 的符号折叠此免 


设 计，确定该组合的设计的别名关系. 


B 符号，折叠了此设计，则该组合的设计估计的效应会 

(T 3 设计■若 

考虑思考理 8.34 中的 2, 7 v 3 设计. 

若通过改变列 S 的符号折叠此设计，确定该组合的设计的别名关系. 

比较这个组合的设计与问题 8 . 35 中得難组合的设计的别名，改变不同列的符号会导致什么不 














注意， 增加因子的第3个水平就容许响应和设计因子之间的关系用二次函数棋拟. 



们把设计的大小和复杂性保持在低的程度上， 
果弯曲性很重要，就可以如图 6.37 所示，在二 



















































我们用例 9.1 的数据来具体说明 ABC 交互作用是如何分解为它的4个正交的二自由度的 
分•的. Cochran and Cox (1957) 和 Davies (1956) 描述了一般的方法.首先，选取3个因子 
中的任意两个，比方说计算 XS 交互作用在第3个因子 C 的各水平处的/总和与 J 总 
和.这些计算 如下： 



现在， /04S) 与 J{AB) 的总和与因子 C 一起以双向表方式列出，并在这个新显示方式表中计 
算出/和 J 的对角线 总和： 



上面算得的/与 J 的对角和实际上代表量 /[/(AS) x C] = AB^C 2 , J[I(AB) xC] = AB 2 C, 
J[J (仙） xC] = 仙 C7 2 以及 J[J(AB) xC] = ■，即 4SC 的 W， X， y，2 分氬 用通士 

的方法求平方和，也就是， 


• I\KA m^n\= A R^- W[ a n n - (~149) a + (212) a + (102) 3 f!65) a _ 3 

J[I(AB)xC\ = AB^C^ X{ABC)= W + (19) 2 + (105) 2 _ (165)f = 孤打 
I[J(AB)xC] = ABC 2 = Y(ABC)= M a + W+ (40) 2 _ 

J[J(AB)xC] = ABC = Z(ABC) = ㈣ + (f + ( 功 2 - g = 584.U 

虽然这是 ssabc 的-种政分»,蝴娜次撤， : g«_t 不蛇 s 示在方紗紗中•在随 
后各节中，我们有机会讨论这些分-的 一个或 多个计算法. 


91.4 一般的 3 fc 设计 





交互作用的平方和，…，以及一个 2 fc 自由度的 A 因子交互作用的平 方和. 一般地，/ 1 个因子交 
互作用有 2* 个自由度.如果有 n 次重复,则有 3*n - 1个总自由度和 3 fc (n-l) 个误差自由度 • 
用通常对析因设计使用的方法计算效应和交互作用的平方和.三因子交互作用及更高阶的 
交互作用一般不再进一步分解.不过，任一 A 个因子的交互作 用有沪 ― 1 个正交的二自由度分 

量.例如，. . . _ 


BMii 叽 Wi l l 〔獅■撕 

綱順说繼1«| m 國 


9.2 3 fc 析因设计的混区设计 

即使考虑 3* 设计的单次重复，由于设计需要做太多的试驗，以至于不大可能使所有的 3* 
次试验都在一致的条件下 进行. 这样一来，经常需要进行混区设计 . 3* 设计可以被混杂在沪个 
不完全区组中，其中 p < fc. 于是,这些设计可以混杂在3个区组中，9个区组中等. 
















用析因设计的常规分析方法，求 得 SSx = 131.56 和 SS B = 0.22. 



根据 9.1.2 节，将上面的败表按左至右的对角线的数计算其和的平方和，即可求得交互作用的/分量 
或 AB 3 分量.这就得出 



它与 SS &U 相同 • 


方差分析见表 9.4. 因为仅有一次重复，所以不能进行正规的检注童,用交互作用的 AB 分置作为 



现在，看一个稍微复杂一点的设计——3 3 析因设计分为3个区组，每个区组有9个试验的 
混区 设计. 三因子交互作用的分量 AB 2 C 2 用来与区组 相混. 该定义的对照是 


容易看到，处理组合000, 012, 101属于主区组.主区组其余的试验如下生成： 



(3) 101 ⑹ 101 + 012 = 110 ⑼021 + 202 = 220 

为生成另一区组的试验,注意到200不在主区 组内. 于是，区组2的元素是 





在有些实验中，必须进行9个区组的 3* 设计的混区 设计. 这样一来，就有8个自由度与区 
组相混.要构造出这些设计，先选取交互作用的两个分量,从而自动地再得出两个,得出所薄的 
8个自由度.这自动产生的两个是原来所选的两个效应的广义交互作用 .对沪 系统来说，两个 
效应（例如， PlQQ) 的广义交互作用定义为/ >Q 和 PQ 2 (或 P^Q). 













































所得的 和 1 设计有26个自由度，可以用于计算13个主效应和交互作用分量（及其别名） 
评 方和.任-酿酬名 卿舰撕 旅翊，難 M A { AB ^ CD )^ ABC ^ 

1 A(AB 2 CD ) 2 = BC 2 D\ 可以证实， 4 个主效应和任 - 二 因子交互細分置分离开来但某 
=互也==中我分 

3.2 其他的3 *- P 分式析因设计 
















I 子有 3 个水平的设计通常可以用 2* 设计的加 W 符号表相 
假定有两个变量，>1有2个水平,义有3个水平.考虑有 
.9 左边列出了列 S 和 C7 的符号•令； f 的水平表示为 a , 
和 C 的符号组合起来形成三水平因子的水平. 



果该因子是定量的，则可将其分解为一个线性分量和一个 
9.10 表示了这一沪设计，列的名称表示需估计的实际效 
























































第 10 章拟合回归模型 

















为回归系数 （ rf 



g 棋型参数估计的方法.这通常称为檳型 拟合. 我们还将对这这 
s 间的方法，以及检验模型拟合的适合性.我们主要关注在匕 

lent) 中有用的回归分析方法.关于回归的更完整的论述，可参 

(1990). 


ing (2001) 以及 Myers ( 


线性回归横型的参数估计 


常用最小二乘法来估计回归 系数. 设有„ > 个响应的) 


i Vi 对应，每—个回归变量也有相应的观测值, 


I观测值, 
.，记巧 











10.3 线性回归模型的麥數估计 321 


所谓最小二乘法,就是选取 10.7 式中的使得误差的平方和最小. 




二 乘估计童（记为 4b, …，或）必须满足 
















我们常常朋 归麵 雌肋方式表示册过 的魏的縣. 下面猶]给出-个完整的例 
子以说明如何来做.在这个例子后面还有3个简单的例子,用于说明在设计过的实轮中回归分析 


















































在多元线獅朗财,雌類織麟賴刊£鮮_有紐.料冑介绍几# 
重要的假雌验 方法. 这些方法要求棋型误差 e < 服从均值为零，方差为^的独立的正态分布， 
简记为 £ ~ nid ( o ,^). 由此可知，观》 w 服从均 值为汍 + ± 0iXij % 方差为 a 2 的独立的正 
态 分布. i=1 

10.4.1 回归的显著性检验 

回归方程的显著性检验用于判断响 应变置 y 与回归变置灼， X2 ,... , Xfc 的子集之间是否 
存在线性关系•相应的假设是 



拒绝 (10.20) 式中的执意味着，回归变 置巧， 物，…，办中至少有-个变量对模型有显著的 
影响.检》方缺方 S 錄法，先将妍方和聊 分鮮 _ (獅 归） 引雜 抒和 与残差 
(或误差）平方和，即 


SSt = SSr + SS e (10 21) 

H o- 0i= /3 a = …=办 = 0 的检验方法是计算 









10.4 多元田归的飯设检搶 333 




几乎所有回归软件包都可以完成这些 计算. 例如，表 10.4 就列出了用 Mintab 计算例 10.1 
黏度回归棋型所得的部分输出 结果. 输出的上面部分是棋型的方差分析表.此例中回归的显著性 
检验的假设是 

Ho ：0i=02=O, Ht 至少有一个 j 

表 10.4 中， F 统计量 [(10.22) 式]的尸值非常小，所以，可以得到结论，两个变量 一 温度 
( A ) 和进料速率（抑）——中至少有一个变量的回归系数不为零 • 

表10. 4 也列出了复决定系败纪的值，这里的 


(10.26) 







大多数回归的计算机程序对每个棋型参数给出 f 检！ 
ntab 输出.输出的上面部分给出了每个参数的最小二 

结论是两个变量（温度和进料速率 ）I 


我们想判断回归变量的子集 


其中 A 是 ( rxl ) f 
棋型可以写为 


是 （n x p ) 矩 芦是 ( pxl ) 向童， e 是 ( nxl ) 向量，且 p 
[x lt x a , -. , x r ( r < fc ) 是否对回归模型有显著性 贡献. 

叱] 

向量.要检验假设 


其中 Xt 表示 义中和 &有关的列， x 2 表示 x 中和尽 2 有关的列 • 

对全横型（包括和冷 2 ),已知/! = (x'xm 包含截距在内的所有变量的回归平 
方和为 


0 2 的最小二乘估计是 / f 2 = 且 

SSr (0 3 ) = 0^21/ (P - r 个自由度) 
在模型中己有沒 2 出现的条件下,的回归平方和是 

SSr^M = SSr {0) - SS R (0 2 ) 














10.5.1 单个回归系数的置信区间 

因为最小二乘估计量彡是观测的线性组合, 所以,0 服从均值为尽、协方差矩阵为 <r\X'X)- 1 
的正态分布.故统计量 

J: 0 ， 1 ， …，* (腿） 

服从自由度为 n - p 的 * 分布,这里,是矩阵 （X'X)- 1 的第 （;>•) 个元素 ，沒 2 是由 (10.17) 
式得到的误差方差的 估计. 因此，回归系数馬 （i = 0, 1,…， fc) 的 100(1 - a )%置信区间是 

爲一 t a /2, n -j,y/o^Cjj < 0j < ^ + ia/2,n-p (10.38) 

因为 8e0i) = y/d^C ~, 这个置信区间也可写成 

爲一 ta/a,n-pSe($j) < 0j ^0j+ t a /2,n-pSe0j) 

例 10.7 求例 10.1 中 /3i 的95%置信 区间. 现在 /j 1= ： 7.621 29,由 d 2 = 267.604, C n = 
1.429 184X10- 3 , 可得 

4i - to.025 iW^Cu < ft < 4i + «0.035 isy/v^Cn 
7.621 29 - 2.16^/(267.604)(1.429 184 x 10~ 3 ) 彡 
Pi < 7.621 29 + 2.16^/(267.604)(1.429 184 x 10~3) 

7.621 29 - 2.16(0.618 4.) K0i< 7.621 29 + 2.16(0.618 4) 

故汍的95%置信区间是 

6.285 5 < ft <8.957 0 

10.5.2 平均响应的置倌区间 

我们还可以得到在特定点（比如050“ *02, ..., XO k) 上响应均值的置侑区间.首先，设向量 
















90<yo < 110.50 

因此，我们期望对/!， S, D 因子在高水平、 C 因子在低水平的点上进行确认试验的咱应变童渗 
透率的观测应落在90至 110.50 之间.实际观测值是 104. 成功的确认试验对正确解释分式析 
因实验提供 了一些 保陣. 


10.7 回归模型的诊断 

正如我们所强调的，在设计过的实验中，横型适合性检验是数据分析过程的一个重要部分. 
它与建立回归模型同样重要，如例 10.1, 我们总是用设计过的实跄中的残差 ffl 来检査回归模型. 





除了残差图，回归中还常用其他一些模型诊断方法.本节将简要地叙述这类方法中的一部 
分.更完整的叙述见 Montgomery, Peck, and Vining (2001) 以及 Myers (1990). 

10.7.1 尺度残差和 PRESS 















拟合棋型的残差可以用矩阵符号方便地写成 



矩阵 J - ff —般 不是对角阵,所以各残差的方差不相等且它们是相关的. 


于是，第 i 个残差的方差是 

V ( ci ) = < r 2 ( l - fc ii ) (10.46) 

这里 h 是 if 的第 i 个对角元素_由于0 < 彡 1 ， 所以用残差均方和来估计残差的 
方差实际上高估了 V ^). 由于是 a ： 空间中第 i 点位置的度量，所以 ei 的方差依赖于点抑 
所处的 位置. 一般地， a ： 空间中心点附近残差的方差比远离中心点的残差的方差大.在远离中心 
点更可能发生违背模型假定的情况，这些违背假定的情形可能难以用检测 e< (或 必）发现，因为 
它们的残差常常很小. 


ri= 7w^m <=i ， 2 ，"， n ( 黯 ) 

的图形来代替(或呔）的图形,这里 M P =财心当模型形式正确时，不论％位于何处彳 
生化残差财差鹏麵V ⑹ = 1. 餅錯况下，残鉚方差賴帥，關餅于大的数 
据集.在餅触 T， 雛化残差 鮮生舰 差之贿臟小.此时娜化残差和牲化残差表 
达了同样贿 S 为任-残棘~ 獻的純 雜軸制、 二 舰合， 所以我们通常 
看 - 下学生化残差•表 1 M mjm 101 黏度回归模 型的帽 子矩阵对角元~和学生 

2. PRESS 残差 

预测误差平方和 (PRESS) 提供了一种有用的残差 尺度. 为了计算 press , 先选择一个观 
测，比如第 i 个观测.产后用其余„ - !个观测拔合模型，并用这个回归方程预测保留的观测 




(10.51) 













可以用*子矩阵对角元 
位置产 生的. 在度量影响的 


i 个观测就是 
了一阶模型的 


r - Di 统计•时实际所用的公式是 

-.v 


注意到，除常数 P 以外 ， i 


M 的 乘积. 可以证明，这 
•点的炬离.于是, A 由两个部分构成,一部分反 
部分 sd 点球余点醜雕 s. _分都可能引起 


大的 £>* 值出现. 

表 10.3 中列出了拟合例 10.1 
没有强烈证据表明这组数据中有强 


3归模型的 A 值. 没有一个 A { 


10.8 拟合不足检验 


獅 1 巾心点，以做验者获觀魏贱的估计.这 









































其中是己知常数，常称为权■证明，如果所选择的回归系数的估计可使加权误差平方和 
(Vi -00 - 最小化，則所得的 * 小二乘正规方程是 

A, S 10<+/5i lr isc<= | 1 w ^ 

4d «»<*<+w**? = E mxm 

考虑例 10.5 中所讨论的 2fv* 设计. 

(a) 餒 定你选择在这个例子的设计中补充一次试求棋型 

= A) + 01X1+ 02X2 + 03X3 + 04X4 + + 034X a X 4 + B 


,为什么7 

f . 最大的观测效应是 Z + 
4次试驗以分离这些效应的别名. 

⑷你愿意做哪4次试驗？ 

(b) 求棋型 


V = 00+01X1+ 02X2 + 04X4 + /?12*1*2 + 014X1X4 + 02撕 X 4 +e 
的回归系数的方差和协方差 （忽 略区组). 

(c) 用少于4次的附加试驗是否有可齙分离这些效应的别名？ 





第 11 章响应曲面法与设计 













































11.2 最速上升法 353 


于 ft, 规范变量是 




再次用有5个中心点的2 2 设计.实验设计列在表 11.4 中. 




【2个一阶樓型的败据 


拟合表 11.4 的规范数据的一阶模型是 

y = 78.97 + 1.00*1 + 0.60*2 

此棋型的方差分析，包括交亙作用和纯二次项 的检测 ，如表 11.5 所示.交互作用和纯二次项的检涮表明，一 
阶模型不是合适的近似.真实曲面的弯曲性指明了我们已接近最 优点. 为更精细地确定最优点，在该点必须 


表 11.5 第2个一阶横型的方差分析 


方差来塬 

平方和 

自由度 均方 F 0 P 值 

回归 （A, A) 

残差 

(妓作用） 

(纯二次） 

(纯误差） 

总和 

5.00 

11.120 0 
(0.250 0) 
(10.658 0) 
(0.212 0) 

2 

1 0.250 0 4.72 0.095 5 

1 10.658 0 201.09 0.000 1 


由例 11.1 可见，最速上升路径与拟合的一阶模型 



的田归系教的符号和大小成比例.容易给出一个一般算法，以确定最速上升路径上点的坐标.假 
定 *! = a： 2 = ... =办= 0是基点或原点.则 

(1) 选取一个过程变量的步长，比方说△；!：』•通常，选取我们最了解的变置,或选取其回归 
系数的绝对值丨爲 | 最大的变量 ■ 

(2) 其他变量的步长是 

(3) 将规范变童的转换至自然变量. 







11.3 二阶响应曲面的分析 

当实验者相对接近最优点时，通常需要一个具有弯曲性的模型来通近响应.在大多败情况下 
二阶模型 

|/ = ft+I ： A*i + g + ZZ PijXiXi + e (11.4) 

是合 适的. 本节将措出怎样利用这一拟合模型来寻求 z 运行条件的最优集合并指出响应曲面的 
特征性质. 

11.3.1 稳定点的位置 

假设我们想要求出X,, X 2 , iC fc 的水平，使之能够最优化所预测的 咱应. 这个点 （ &, 
…， *fc) 如果存在的话，它应使偏导数 dy/dxi = dy/dxi = ... = = o .记它 

为- 称为稳定点 (Stationary point). 稳定点可以是：⑴响应的最大值点， 

(2) 响应的最小值点， （3) 鞍点 (saddle point) •这3种可能性见图11.6、图 11.7 和图 11.8. 

等高线图在响应 Ift 面的研究中起着非常重要的作用.根据用于响应曲面分析的计算机软件 
产生的等髙线图，实验者可以描述曲面形状的特征并以较好的精度找到最 优点. 





































这就得出标准 化解: 




11.3.3 岭系统 

11.3.2 节讨论了_麵的_大值点、 最小值点、 或鞍点 ，猶池 雜_它们的各种变 
形. 尤其是岭系统,相当普塘.考虑前面 (11.9) 式给出的二阶模型的正则形式： 
y = V • + Aiu>i + Aatuj + ••• + X k wl 

现在，设稳定点 ®， 在实验的区域之内，又设有一个或多个 A* 很小（即 A< « 0). 于是响应变量 
对系数\小的变置叫就很不灵敏了. 

用于说明这种情况的等高线图显示在图 lhl2 中，其中 * = 2 个变量且 Al = 0 (在实 践中， 
Al 会是接近于零但不确等于 零). 此响应曲面的正则模型理论上是 

y = ih+Mwl 

其中 A 2 是 负的. 注 意沿奶 方向拉长而成为一条 j> = 70 的中心线，且在这一直线上的任#点 
处都取得最 优值. 这类响应曲面就称为稳定岭 系统. 

如果稳定赫«二阶拟合麵_駆齡肺-个(财个）接龄,雛麵可能是 
:个上 升虼图 11.13 说明-个上升岭，此时= 2个变 量且幻 接近零，為是负的.在此类岭 

系统中，我们不能进行有关真实曲面或稳定点的推断，因为* 8 在所拟合棋型的区域之外，所以 

应沿奶方向作进一步探测•如果 A 2 ft 正的，则称此系统为下落岭系统 • 

11.3.4 多重响应 

许多响应曲 面问® 中包含了对几个响应的分析•例如，在例 1L2 中，实验者测量了 3个响 
应.那个例子只对产率响应奶优化了过程. 








I. 2 的 3 个响应的重叠等高线图，其中(产率） 
400的等高线.如果这些边界表示过程必须满足 


















(5) 提供内部的误差估计 量. 

(6) 提供棋型系数的正确估计. 

(7) 提供在实验区域内好的预测方差. 

(8) 对异常值或缺失数据提供适当的稳健性. 

(9) 不需要 大量的试验. 

(10) 不需要自变■:有太多的水平. 

(11) 确保模型参数计算的简单性. 

这些特点有时是相互矛盾的,所以，在应用到设计选择中去时,必须经常加以判断.要得到关于选 
择响应曲面设计的更多信息，请参阅 Myers and Montgomery (2002), Box and Draper (1987) 
以及 Khuriand Cornell (1996). 

11.4.1 拟合一阶樓型的设计 
设要拟合个变置的一阶模型 

y = A + E 0iXi + e (11.14) 


我们有一类独特的设计，它使得回归系数{戌}的方差极小化.这就是正交一阶设计.一个一阶设 
计是正交的，如果 (x'x) 矩阵的非对角元素全 为零. 这一点意味着 x 矩阵列的叉积之和为零. 


正交的一阶设计类包含了主效应不能互为别名的 2* 析因设计和 2* 分式析因设计系列.在 
使用这些设计时,我们假定 fc 个因子的低水平与高水平被规范为通常的水平 ±1. 

2 fc 设计不能提供实验误差的估计童，除非某些试验重复进行.使 2* 设计包括有重复试验的 
常用方法是,在设计的中心点（点:= 0, i = 1, 2,…， fc) 处增添几个观测值.给 2* 设计增加 
中心点并不影响{戌}, i > 1,但是办的估计童将变为所有观测值的总平均值.而且，增加的中 


心点不影响设计的正交性•例 11.1 说明了给2 2 设计增添5个中心点来拟合一阶模型的用法 • 
另一种正交一阶设计是单纯形设计.单纯形就是 Jfc 维空间中有 fc + 1个顶点的等边图形. 
这样一来， fc = 2的单纯形设计是一个等边三角形， fc = 3时是正四面体.二维和三维的单纯形 
设计如图 11.19 所示. 

11.4.2 拟合二阶模型的设计 


我们在例 11.2 (甚至更早，如例6_6)中己正式介绍了拟合二阶棋型的中心复合设计 (Central 
Composite Design, CCD). 这是用于拟合这些模型的最广的一类设计.一般而言, CCD 是由有 
个试驗的 2* 析因设计（或分辨度为V的分式析因设计）以及 2fc 个坐标轴试被点或星号 
点、 nc 个中心试被点组成的.图 11.20 I& 示了 * = 2和 fc = 3个因子的 CCD. 














RSM 的目的是优化，而最优 
计 在各个方向上提供等精确 









E CCD 中， a 的麟主触贼麵区域贼.皱个区域料_,断雌包含中心 
以提供 预测螭 应的合理稳定方差.一般推荐用 3 〜 5 个中心试验点. 

4. Box-Behnken 设计 

Box and Behnken (1960) 提出过一些拟合响应曲面的三水平 设计. 这些设计由沪析因设 
=完全 E 難计组合耐 . 顺細册对触賴的搬次«：来说， + ^,目且_ 
■旋转的或接近可旋转的. 

表 11.8 列出了 3个变童的 Box-Behnken 设计•图 11.22 是此设计的 图解. 注意到 Box- 
S 半径为 W 


在许多情况下，所关注的区域是立方体形而不是球形的.此时，面中心的中心复合设计或称 
面中心立放巾你的雅-种娜， «4>a=l. 雌將錢測 上所 賴点粒方体各 





























VDG 对特定的设计和响应模型，以图形方式显示了到中心点有相同拒离的设计点的预测方 
诚小值、狀獅 t 触.赖辭麵常轉（断柯、）对球形设计， 
是设计点到中心点的最大距离•在 VDG 中通常以尺度化预测方差 (SPV) 








试验点个数从 n c = 1到= 5变化. VDG 淸楚地表明，中心点个数太少的设计的预测方差 
有非常不稳定的分布,但随着 nc 的增加，预测方差迅速趋于稳定.用4个或5个中心试验点 
时，在整个设计区域内会有相当稳定的预测方差. VDG 己被用于研究响应曲面设计中中心试验 
点个数的变化引起的效应.本章前面的建议就是基于这些研究的. 



5 半 k r 15 2 

围 11.27 fc = 4, a = 2时 CCD 的方差散布图 


11.4.3 响应曲面设计的区组化 

当使用响应曲面设计时，经常需要考虑划分区组，以便消除多余的变童.例如，像在例 1U 
和例 11.2 中说明过的那样，当二阶设计是由一阶设计序贯组装而成时,就会出现这种问题.在做 
—阶设计的试验和做建立二阶设计所需的增补试验两者之间,间隔时间过长,试验的条件可能就 
改变了.因此,划分区组就成为必要的了. 

响应曲面设计称为正交区坦化,如果它划分成区组,使得区组效应不影响响应曲面模型的参 
数 估计. 当 2 fc 或2^>设计用作一阶响应曲面设计时，第 7 章的方法可用来将试验安排在; T 个 
区组内 进行. 这些设计的中心点应该在各区组内同等地配置 • 

划分为正交区组的二阶设计必须满足两个 条件. 如果在第 fc 个区组中有个观测值，则这 
些条件如下. 

(1) 每个区组必须是一阶正交设计,也就是 

= . ，*，对一切 

其中〜和〜是实验的第 u 个试验中第 i 个和第 ） 个变量的水平,对所有 u 定义 1. 

P) 每个区组所页献的每个变量的总平方和所占的比例必须等于出现在此区组中的总观测 
数所占的比例，也就是 






























如，要拟合有4个变量的二阶模型.这种情况下的中心复合设计要求做28到30次试验，具体 
试验次数由所选的中心点个数决定.而模型只有15项,如果试验成本极大,或时间极长,实验者 
会想用试验次数较少的设计.尽管这种情况可以用计算机生成设计,但也有更好的常用方法.如 
4个因子的小复合设计有20次试验，其中包含4个中 心点； 混杂设计可以少到只有16次试验. 
用计算机生成设计来减少试验次数一般是较好的选择. 

计算机生成设计的许多进展是 Kiefer (1959,1961) 及 Kiefer and Wolfowitz (1959) 有关最 
优设计理论工作的推广结果.所谓最优设计，意味着它是关于某个准则的“最好’’设计.需要计 
算机程序来构造这些设计.通常的方法是指 定一个 模型，确定所在区域,选择要做的试验次数，指 
定最优化的准则,然后从实验者考虑使用的候选点中选择设计点.典型的候选点是分布在可行设 
计区域中的网格点. 

有几个常用的设计最优化准則.或许最常用的准则是 Z? 最优准则.如果一个设计能最小化 

IW” 

则称之为I? 最优 • D ft 优设计最小化了回归系数的联合置信区域.在 D 最优准则下，设计1关 
于设计2的相对效率定义为 



其中，X:和 X 2 是两个设计的X矩阵, p 是棋型中参数的个数. 


( 11 . 21 ) 






378 第 11 幸 响应曲面法 与设计 

A f 优准则只涉及回归系数的 方差. 一个设计称为>1最优设计,如果它能最小化 (X ， X_ l ) 
主对角元素的和【称为的迹，记为•因而火最优设计最小化了回归系 
数的方差和 • 

因为许多响应曲面实验与响应的预测有关，所以 预测方差准则 是实践中值得考虎的准则. G 
最优准廳 K 巾应触 rw- 种. -种册称力 g it 优，若能 制、 化在 s 个浙 e 域内尺度 
化预测方差的最大值.即， 

VWfi?(g)1 

在整个设计区域内的最大值最小，其中 N 是设计中的 点数. 如果模型有 P 个参数,-个设计的 
G 效率是 

Ga = :孟興叩 (11-22) 

V 准则考虑 设计区域内-个点集（如…， *„) 的预测 方差. 这个点集可能是所选设计 
的候选点氣，麟雌齡辦殊教 W 雜. 髓在 m 个#上麵;5■賴 均值最 小的设 
计就是V 最优 设计. 



=( 離广 OS 3 )' 


也就是说，内接 CCD 只有_0最优设计47.6%的 效率. 这意味着 CCD 需要花1/0 476 - 2 1偁 
















ft 优设计的预测标准差的等髙 
C)- 1 | = 3.71E-4, 相对效率是 




8 的的 采世计区 域下的 一. 


个改进的 D 

计算机龄财优_产細断紗躯舰不絲体也不粒方贈賊 下的 确是有 
•然而，在多類 财它餅 不 傭輯计. S 触生龄顿雛计时, K 能严格遵 













圈 11.32 想料设计的约束因子空间 B 11.33 三线坐标系 

单纯形设计用来研究混料分量在响应变量上的效应 .p 个分量的 {p, 单纯形格点设计由 

下述坐标值定义的点所组成> 每个分置的百分率取0到1之间的 m + 1个等距离 的值： 

••- ,1, < = 1,2, -. ,p (11.23) 

然后使用 (11.23) 式中比值的所有可能组合（混合).作为一个例子，设?> = 3与 m = 2.則 
®i = 0, 1, t = 1,2,3 

而单纯形格点由下述6个试》所 组成： 

= (1,0,0), (0,1,0), (0,0,1), (蠢，蠢 ’o) ， 

此设计如图 11.34 所示, 3 个顶点 （1, 0, 0)， （0, 1, 0), (0, 0, 1) 是纯混合物，而 （^,0) (|，0,圣）， 
(0, H) 是二元混合物或两种成分的混合物,位于三角形3条边的中点上.图 11.34 还显示出 {3, 
3}, {4, 2}, {4,3} 单纯形格点设计.一般说来，0>， m} 单纯形格点设计的点数是 



另一种单纯形格点设计是单纯形 m 心 设计. 在一个 P 分量单纯形重心设计中，有沪 - 1个 
点，对应于（1，0,…， 0) 的 p 个排列, （H, …， 0) 的 （S) 个抻列， （i, n • • , 0) 的⑸个抹 
列，…，以及总重心 （J, 去，…，|)•图 11.35 显示了某些单纯形重心 设计. 






扭货 P 个成分中的 P_1 个.通常希望在单纯形格点设计或单纯形重心设计的区域内部加上— 
些附加点，以使混合物能由所有 p 种成分 组成. 进一步的讨论请参阅 Cornell (2002) 和 Myers 
and Montgomery (2002). 

使:应曲面设计中所用的多项式，因为有约束以….广为 

线 性的： 

= (11.24) 

二 次的： 

E (W) =右产‘ + E 矣 PijXiXi (11.25) 

宪全三 次式： 

E(V) =孟如 + 5:裘 PijXiXj + zt SijXiX ^ Xi - Xj ) + EJCE Pi ik x iXj x k (11.26) 

特殊三 次式： 

咖 =| 产 +i ;|— 强卿， (11.27) 

这些模型的各项都有相对简单的解释.从 (11.24) m (11.27) 式，参数执表示纯混合物 
而 =1和 A = 0当 j ㈡时的期望 响应. ± 0 iXi 部分称为线性灌合物部分.当分量对之间的 
非线性混合物引起弯曲时，参数如或者表―同性的灌合或者表示对立性的 混合. 在混料棋型 
中经常 需魏麵 •_， S 为⑴卿舰贼可驗麟，⑺实蘭区 赌常 賊个可搡作 

fKlIX M 田而县坊 "IrlitlKrfce 爱 W 女 _ 
















li < Xi ^ 1, * = 1,2, ••- ,p 

的下界约束十分 普遍. 在只有下界约束时，可行设计区域仍然是单纯形，但它内接于原单纯形区 
域内.这种情况可以通过引用定义为 


_ Xi-li 


的伪分置 (pseudocomponent) 来简化，其中~ < 1•现有 
i=i 

x'i+X2+ -+ x' p = l 

所以，当下界是实验情况的一部分时，可通过引进伪分量来使用单纯形设计.利用 （11.28) 式的 
逆变换式，就可以将伪分童的单纯形设计的特定配方变换为原来分量的 配方. 也就是说，如果< 
是一次试验中第 i 个伪分童的设计值，则第 i 个原来的混合分量是 

Xi = li + ( 1-(11.29) 


























































•11.1 一化学工厂利用先液化空气，苒用分馏法分解的方法生产氧气.氧气的纯度是主冷凝器溫度和分馆 
塔上下之间压强比的 函败. 当前的搡作餅是 fl 度⑸= -2201C, ffiSbfc (6) = 1.2. 利用下列数 














































稳健参数设计与过程稳健性研究 



田口提出了一种方法，他用设计过 
其基本原理和技术方法在工程师 


TirTMi ~ 


汁 系统： 一旦系统投入实际使用，设计系统使得它对影响系统性能的环境因子不敏感. 
一种可以在各种气候条件下保持较长寿命的外墙 涂料. 因为气候条件并不是完全可以 
热不是常置,产品配方设计师希望涂料对 













: 室就是 

进行更严格的控制.尽管这些经典的方法仍然有用, 
他统计工具在许多情况下可以用于解决这 个问二 

田口方法的一个重要观点是,某类变量能影响系统重 
嗓声变置或不可控变量.前面已讨论过这个概念（比如， J 
度或相对湿度之类环境条件的函数,也可能是原材料各批 
:制或保 






































































































































































W 实验所用的是哪种类型的设计？它是拟合二次棋型好的选择吗？ 
(b) 建立两个响应的棋型. 












6 韵; 

I Hli 












V(yi,) = «r? + <T 3 

方差 (T? 与 <r 2 称为方差分置，而棋型【(13.1)式]称为方差分置或随机效应横型.为了检验该模 
型的假设，我们要求{印}是 NHXO，#)，{ tO 是 NID(0,^), 且 tv 与相互独立®. 

方差分析的平方和分解式 

SSt = SS^a + SS B (13.2) 

仍然有效.即我们将观测中的总差异分解成两部分，一部分度量了处理间的差异另一 
部分度量了处理内部的差异 (SS E ). 检验单个处理效应是没有意义的，所以我们对方差分量^ 
的假设进行 检验： 

H 0 ：^ = 0 

以>0 ( 13 . 3 ) 

若 W = 0,则所有处理都 相等； 若4 > 0,則处理间存在 差异. 和以前一样， SS B /tT 3 服从自由 
度为- a 的卡方分布，在零假设下， S5 m /(T 2 尿从自由度为 a - 1的卡方 分布. 所有随机变 
量都相互 独立. 这样，在零假设下，比值 

朴=誉-證 _ 

里从自由度为 a-1 和； V- a 的 P 分布•但是，为了说明检验方法,我们先计算期望均方值. 
考虑 

E ( MS -)= Ji E 牌 -) = 3 r E [ m ] 

B* n E(rO = 0,所以平方后逐项求期望时，包含的项都用 d 替换•同时，包含 e |.、 e? . 和 
E 的项分别用 na 2 、ana 2 和 anV? 替换.而且,所有包含 Ti 或岣的交叉项的期望都 
为零 =所以 

E(MSnm) = [Nit 2 + Nvl + aa a - - na\ - a 2 ] 

即 

E(M 5«,) = <r 2 + na? (13.5) 

类似地，可以证明 

E( MSe ) = a 2 (13.6) 

由期望均方可知，在执下检验统计量 [(13.4) 式 j 的分子和分母都是的无偏估计，而在 
Hl 下分子的期望大于分母的期望•所以 F 0 的值特别大时我们应该拒绝私.这是上尾部的单 
边拒绝域，因此，当 F 0 > F a , a -l, N - a 时我们拒绝却 j. 


① {r‘} 嫩的随 机变量这一假设意味着，固定效应模型中的一般 fi 设 f ri = 0 并不朗于随机 
效应槿 i=1 



法，因为它利用方差分析表得到.计算步 驟为： 先令方差分析表中的各期望均方等于它们的观测 
值，然后解得方差分童.在单因子随机效应模型中，令各均方观测值等于它们的期望值，得到 
MSttm =cr 2 + mr? T MSe = o 2 

所以，方差分童的估计为 

= MSb , (13.7) 

a?= MS 奴：崎 (13.8) 

样 本容量 不等时，把 (13.8) 式中的 r» 換成 ° 



估计方差分量的方差分析法并不要求正态 假定. 得到的 d 与 cr 2 估计是最优二次无偏的 
(即在由观测值的二次函数构成的所有无偏估计中，这类估计量的方差最小). 

有时方差分析法会得到负的方差分置估计值.显然，由定义知，方差分量是非负的，所以负 
的方差分量估计值应该被特别 对待. 一种做法是，假定抽样波动导致负的估计值，则可接受该估 
计，并以此作为方差分量的实际值为零的依据.这种做法很直观，但在理论上有一些问题.例如， 
用零代替负的估计值会影响其他估计的统计性质.另一种做法是,采用总是得到非负估计的其他 
方法重新估计这个负的方差分量.还有一种做法是，得到负估计说明线性模型的假定是错误的， 
应该重新检査线性 假定. 方差分董估计的更多内容参见 Searle(1971a, 1971b), Searle, Casella, 
and McCullogh(1992), 以及 Burdick and GraybUl(1990). 

例 13.1 —家纺织厂用许多台织机编织一种织物，希望织机尽置相同使得织物的强度一致.过程工程 








(13.10) 
















宽是因为实验中的样本容量较小.不过，显费 

13.2 含随机因子的二因子析因设计 

假定有两个因子X和 B, 它们都有许多水平受到关注（如上节所述,假定水平的总数是无 
穷 多). 随机选取因子4的 a 个水平，因子 B 的 6 个水平，并采用析因实验设计来安排它们的 
水平 组合. 若实跄重复 n 次，我们可用线性模型 


l/«fc =n + n +0 j + ( T 0 )ii + £iJk j > = ,b (13.15) 

(* = 1,2, …， n 

描述观纖，斯麵 INSn, ft.， (r0) iit e ijk (T0) ij>eiik 

〒从均值为 0 的正态分布，方差分别为 V( T< ) = a?， V⑹= V [(r/3)„J = W(e ijk ) = 
° - 任一观测值的方差是 

V(y 明)= a? + 4 + 心 + a 3 (13.16) 

且，/称为方差 分置- 我们要检验的假设是 Ho ： ai = 0,H 0 : = 0 

Ho : a 2 r0 = 0. 注意它们与单因子随机效应模型的相似性 • 方差分析中的数值计算不变.也’ 
就是说， SS A ,SS B ,SS AB , SS e 的计算方法都和固定效应的情况 相同. 但是要给出检验统计量 
须先考察各期望 均方. 可以证明 

E(Af5 A ) = a 2 + ， E(A/5 B ) = <r 2 + + anal (13.17) 

E(M Sab) = <r a + na%, E(MS B ) = a 2 

由期望均方看出，用来检验无交互作用假设 // 0 ：^ = 0 的恰当的统计量是 


_ MS ab 
~ MS e 


因为在丑。下， F。 的分子与分母的期望都是〆，而 1,仅当办不真时，才有埘. 
E(M5 E ) •比值凡的分布为 iVw-Mn-o. 同理，要检验 /f 0 : d = 0,可用 


(13.18) 
E(M5 ab ) 大于 






































E(MS b ) : 


别，在随机效应的期望均方中出现方差分量‘ （实 际上，由于关于交互作用效应方差的定义不 
棚，这計«舰隸働細 •） 0此，細職计量& = MS ^_ 检麵㈣雜方差分童 
等于零（执 ： ^ = 0)的这-假设类似于在约束模型中用 Fo = MSs/MSs 检验 H 0 : 4 = 0 
两个模型的参数有密切的关系.事实上，可以证明 


可以用方差分析法来估计方差分量.参照期望均方，对 (13.25) 式仅需改变 


5 ( 1956a ， !959)所提出的混合模型的特殊情况.该模型假定观测值 



















13.4 含随机效应的样本量的确定 


中的抽检特性曲线可用于确定有随机因子实验的样本量 • 考虑 13.1 节中的单因子随机 
• 该随机效应模型的第II类错误概率是 

/®= 1 - P{ 拒绝历 )1 好 。不真 } = 1 - P{F 0 > F at a-i,N- a \<rl > 0} (13.28) 

到检骑统计童 ft = MS m / MS e 在备择假设下的分布.可以证明，当丑^为真 （d > 
的分布是自由度为 a - 1和 N - a 的中心 f 分布. 




A= VT+6(i) = 2.646 
，且 《 = 0.05 的特性曲线，可以得 H 


也可以通过观测标准差增加的百分比来确定样本量.若各处理是齐次的，则随机选取的观测 
的标准差为•但 ft, 若处理间有差异，则随机选取的观测的标准差为 
vWff? 

若 P 为给定的观测标准差的增加百分比,超出它就要拒绝零假设， 


A = V 1 + -^T = Vl +n[(l + 0.01F) 2 - 1] 
i p， 附录的表 vi 中的特性曲线可用来确定所需的样本容量. 






对于二因子随机效应模型和混合模型，我们仍可以用抽检特性曲线来确定样本的容量.附录 
VI用于随机效应 模型. 参数 A、 分子自由度、分母自由度列在表 13.8 的上半部分.对于混合模 
型，附录V与附录VI都要 用到. 合适的值与 A 值列在表 W.8 的下半部分_ 


用于附录中表 V 与表 VI 中关于二 H 子 
和灌合横型的抽检特性曲线的参数 


分子自由度 





(a-1)(6-1) 
(a-1)(6- 1 ) 






( a - l )( b - l ) ab ( n - l ) 

"混 合模型 



13.5 期望均方的计算法则 


我们将提出一组计算法则,用来计算模型中各效应（此处1 
i 以及期望均方.这些法則对任 何平樣 
都适用.（但对部分的平衡安排，如拉丁方与不完全区！ 


Searle(1971a, 1971b). 
统计氪 检验统 i 
值仅仅 在我/ 


;外还有其他一些法 
954), Cornfield and TWcey(1956) 以及 
人们可以提出检验关于任一模型参数的假设的恰当 
:使分子均方的期望值与分母均方的期望 


验统计量是期望均方的一个比值,它的取法是 i 
i 们感兴趣的方差分量或固定因子上有所不同. 

对任一模型，通常有可能像我们在第3章中曾做过的那样去确定期望均方,也就是， 
用期望算子.这种常被叫做“砸算”的方法，是很冗长乏味的.下面所给出的求任一 




要乘以《，因为在交互作用分量的每个不同值处有„个观测值 （在 每个单元处有 
以，的均方期里为 ^ ^ 

作为二因子 - 固定效应棋型中的另-个说明，主效应为 


























有 0 6(和-1)个自由度. 

合并的危险在于，可能产生第 H 类错误并将实际上有显著性的因子的均方与误差合并起来 
从而导致賴残差财 (MS E ,)XX 齡使#倾■舰 SE 軒检方面，如果原来’ 








的分子与分母都近似为卡方变量的乘积，而且 
f 与分母相互独立，所以 (13.33) 式中的 f 近 



































13 幸含随机因子的实松 


13.7 关于方差分置估计的一些其他论题 

正如我们前面看到的，随机模型或混合棋型中方差分量的估计，对实验者来讲，常常是非常 
重要的 目标. 本节将给出一些在估计方差分量时更深入的结果和更有用的技术.主要考虑计算方 
差分量的置倌区间的方法，以及说明如何计算方差分量的最大似然估计.当方差分析方法产生负 
的估计时，最大似然估计方法可能是非常有用的替換方法. 

13.7.1 方差分量的近似置信区间 

13.1 节引入了随机效应棋型，当时给出了简单设计中^以及方差分童的其他函数的精确 

100(1 -«)%置信 区间. 方差分析中，对任意一个能表示为某个均方期望的方差分量的函数，总 

能找到它的精确置信 区间. 例如，考虑误差均方•因为 E ( M 5 B ) = a 2 , 我们可以求出 〆 的精确 
置信区间，这是因为 

f B MS B /( r 2 = f B » 2 / a 2 


. 精确的 100(1- a )% 置信区间是 

{ bMSb 

X «/2 ，/a Xl - a / 2 ,/ B 


不幸的是,在很多涉及多个设计因子的复杂实验中，一般不能找到那些方差分量的精确置信区间， 

这是因为这种方差不是方差分析中单个均方的精确期望.不过，在 W .6 节中介绍的 Satterth - 

waite 的近似伪 F 检验中的概念，可以用于对那些没有精确置侑区间的方差分量构造近似置信 


Satterthwaite 方法中用到均方的两个线性 组合： 


MS ' = MSr +-+ MS . 


MS " 

定义的 MS ' 


近似于 F 分布•采用 （13.34) 和 (13.35) 式定义的 Af 矿与 MS " 的近似自由度，可以将这个伪 
P 统计量用于对感兴趣的参数或方差分量的显著性的近似检验. 

要检验方差分量4的显著性,选择两个线性组合 MS ' 与 MS ", 使它们期望值的差等于该 
方差分童的某个数乘，即 

E(Af 5*) - E ( MS ") = kal 


. E ( MS ') - E ( MS ") 


(13*37) 


(13.37) 式给出了 











(13.42) 


為-樣 ^MSf + ^ 


其中 


-个卡方分布的随机变童除以自身的自由度. 
现在考虑比 (13.41) 式更一般的情况,其中的常数 q 没有都为正数的约束.这可以表示为 

& o = E CiMSi - cjMSj , a , Cj^O (13.43) 

Ting 等人 (1990) 给出了 4的近似 100(1- a )% 的置信下限为 

L = 矻- (13.44) 


Vi = £ G ? c ? M 5? + ^ Hf ^ MSf+Z ^_2 +i GijdCjMSiMSj 



«,=( .当- 

l 0， 当户=1 













为说明该方法如何用于带有随机效应的实 驗设计 棋型，考虑 a = 6 = n = 2的二因子模型. 
此棋型为 

Viik =fi + Ti+0j + (T0)ij + e ijk 
其中 i = 1,2, _?■ = 1,2 且*: = 1, 2. 任一观测的方差是 


v (糾 fc ) = o \ = al + ( T 0 + trl 0 + a 2 


且协方差为 



= <rl + al^a 2 re i = i\j = f,k ^ 
=°r i = 


不妨把观测值看作一个 8 x 1 向量，记为 


(13.45) 


而方差与协方差可以表示为一个8 x 8的协方盖 矩阵： 

27= 卜叫 

[ S n 27„ J 

其中17„， r M ， r ia ，27 m = ri 2 是如下的 4 x 4 的 矩阵： 

[ °v + trip < r ? 

4+4 + 咚 al ^ 

°l ^ a v 

°r <ri al + a }+ a ^ 0 

a } a } 0 0 1 

^1^0 0 
0 0 al ol \ 

0 0 0% a % \ 

且就是 I ?: 2 的转置.现每个观 *| 都服从方差为 4 的正态分布，假定所有 N = abn^m 
测雇从联合正态分布，则随机模型的似然函数为 

HM ,^,< Tl < T ^, a a )= (2ji)N/ \ ls]1/2 exp [-!(» - j N ^)' S-\y - i ^)] 












































h 析并估计横型分童. 

===进求行麵爾的期望值. 
























第 14 章嵌套设计和裂区设计 


本章纲要 

14.1 二级嵌套设计 
14.1.1 统计分析 
14.1.2 诊断检测 
14.1.3 方差分量 
14.1.4 交错嵌套设计 
14.2 —般的 m 级嵌套设计 
14.3 含被套因子和交叉因子的设计 
14.4 g 区设计 _ 


14.5 S 区设计的其他变形 

14.5.1 多于两个因子的裂区设计 
14.5.2 裂裂区设计 
14.5.3 带裂区设计 
第14聿补充材料 
S14.1 交错嵌套设计 
S14.2 疏忽大意的裂区设计 


本章介绍两类重要的实验 设计： 嵌套设计 (nested design) 和裂区设计 (split-： 
这两类设计在工业实验设计中有着相当广泛的应用.它们常常含有一个或多个随机 
里将用到第]3章中介绍的一些概念. 


14.1 二级嵌套设计 


的嵌套设计或分级设计•例如，考虑一家公司从 3 个不同的货主手中购买原料.公 
货主供应的原料的纯度是否 相同. 从每位货主可得 4 批原料，对每批原料要 进行： 































一些统计软件包可以处理嵌套设计的分析.表 14 . 6 给出了 Mi nitab 中 （使 用约束 棋型） 的 
平衡 ANOVA 过麵_關,这 顿鋪料 表 14 . 4 醉 X 计鮮果 -致. Minitab 还在表 
14 6 的下 半财 触了触 均方. Q [1 J 賊表触_棘应的平方项，職们的记 



例 1 4 .1 的 Minitab (Balanced ANOVA ) 輪出结果 





















我们可以在较低层去掉很多（也许非常多的）自 由度. 例如，假设我们对多份不同材料研究化学 
分析的差异,我们计划对每份材料取5个样品，每个样 品测量 两次.如果想要估计材料的方差分 


量，不妨从中选择10份不同的材料，于是材料有9个自由度，样品有40个自由度，测置有50 
个自由度. 

灞免这样做的一种方法是使用一种特殊的不平衡嵌套设计,称之为交错嵌套设计 (staggered 
nested design). 图 14.4 给出了交错嵌套设计的一个 例子. 注意，每份材料只取两个样品，其中 
—个样品被测量两次，而另一个样品只被测量 一次. 如果共有 a 份材料，则材料（即一般情况下 
的上层）有 a - 1个自由度，且所有下层都恰有 a 个自 由度. 关于这种设计的更多使用和分析， 
参见 Bainbridge (1965), Smith and Beverly (1981), 以及 Nelson (1983,1995a,1995b). 本章的 
补充阅读材料中给出了一个交错嵌套设计的完整例子. 



围 14.4 一个三级交错嵌套设计 


14.2 —般的 m 级嵌套设计 

14.1 节的结果容易推广到 m 个完全被套因子的 情形. 这种设计叫做 m 级嵌套设计.作为 
一个例子，设铸造厂要研究两种不同配方合金的硬度.每种合金配方各炼3炉，从每炉中随机选 
取两块铸件，从每块铸件上测量硬度两次.图 14.5 说明了这种 情况. 















































































































, 分别对应于重复（或区组)、主处 J 
y) 舛， (响)啡 代表子区，分别对应^ 

乏子区 误差;知 和其余的参数对应于 . . . . 

四因子交 S 倾 (r0yS) ijkll 曝？子区误差. 
a 的，其他设计因子是固定的，表 14.20 给出了此时的期望均 t 审 
处理以及它们的交互作用的检验是明显的.注意，关 


,3种剂量, 4种糖衣厚 

于检验技师,相对说来， 



















































第 15 章其他设计与分析论题 









































得到棋型 


(15.8) 


对数联系常用于计数数据（泊松响应）以及具有右侧长尾分布的连续型晌应（指数分布或伽玛分 
布).另一种常用于二项分布数据的重要联系函数是 Logit 联系 


ln (i^) =x， ^ (159) 

选择使用这种联系函数得到模型 


联系函数可能有多个选择，但它必须是单调可微的.而且要注意，在广义线性棋型中，响应变置 
的方差不一定是常量，它可以是均值的函数（及通过联系函数也是预报元的函数).例如，若响应 
是泊松分布的，则响应的方差正好等于均值. 


态响应变■:的普通线性模型或实验设计模型,这归结为标准的最小二乘法.用类似于正态理论数 

据的方差分析方法，可以对广义线性模型进行推断或诊断性检査.细节与例子参见 Myers and 

Montgomery(1997) 以及 Myers, Montgomery and Vining(2002). 可以很好地支持广义线性模 

型的两个软件包是 SAS(PROC GENMOD) 和 S-PLUS. 

例I 5 . 2 —家消费品生产公司研究影响頹客用优惠券兑換该公司个人护理产品的几率的因子•一个 
2 3 析因实验用于研究下列 变置： 4=优惠券的价值（低，髙)， S= 优惠券的有效期， C= 使用的方便程度 
(容易，困难 ). 2 s 设计的8个单元的每个单元中都随机安排了 1 000人，响应变置是兑换的优惠券的数量. 
实 * 结果列在表 15.1 中. 



设计的毎个单元中的喃应值可以看作1 
是，具有二项响应分布和 logit 联系函数的广. 
回归 (logistic regre^ion). 


000重贝努利试驗中的成功次数，所以该响应的一个合理模型 
义线性棋型.这种特殊形式的广义线性棋型通常 称为逻 辑斯谛 


!. 实验者决定拟合只包含主效应和二因子交互作用的棋型.因此，响 










































6.51 s.91l 6 5 :s i5.14 1.77 l 7.25e 7 :2 i i 1 6.095.81 1 8.208.077.607.36 1 6.347.046.78 11 








广义线性模型已在生药的研究与开发中得到了广泛的应用.随着更多的软件包包含了这种 
功能,广义线性模型在一般的工业研究与开发领域中会有更加宽广的应用 • 


15.2 析因设计中的不平衡数据 



实验者对某些处理组合有较大的兴趣，因为它们代表了新的或未研究过的条件，所以，实验者会 
决定在这些单元中多做几次重复. 

在平衡数据中出现的主效应以及交互作用的正交性质在不非平衡情况下将不再具备•这 
意味着我们不能再使用通常的方差分析法.因此，不平衡析因设计比起平衡设计的分析要困难 
得多. 

本节简要综述一下关于处理不平衡析因设计的方法,着重于二因子固定效应棋型的情况.设 
在第勿 单元的观测值个数为叫.又令 n 4 . = Eny 为第 i 行（因子 A 的第 i 个水平）中观测 




































































15.3 协方差分析 495 


i 地， ■? = :r + 五，其中符号 5 , r ， e 分别用于表示总、处理以及误差的平方和与叉积 
'^y 的平方和必须是非负的；但是，叉积（呼）的和可以是负的. 

兑明，协方差分析怎样根据协变量效应来调整咱应变*.考虑全棋型 [(15.15) 式 1. 供 
小二乘估计是 fi = y.., = ffi, - if.. - /5( au . — 2..) 以及 

(15.26) 

吴差平方和为 

SSB^Eyy-iE^f/E^ (15.27) 

-1) 一 1个自由度.实验的误差方差用 


•假设不存在处理效应.则棋型 {(15.15) 式]将是 


{ 


3 = 1，2,…， n 


V*} =M + P(xij -£..) + eij 

















































维强度的变异性. 









的校正平方和.因为取整，表 15.15 中的检验统计量与那些手工算的结果稍有不同. 

程序也计算 (15.31) 式的调整的处理均值[样例输出中 Minitab 称之为最小平方均值 (least 
squares means)] 以及标准误.程序还会用第3章讨论的配对多重比较方法对所有处理配对进行 


Ti ：nfi + nfi+0Y^ {in - 

£(*«-*..) + 0S XX = 


把 (15.37b) W a 个方程相加，因为 EE ^ a - x ..) = 0, 故得到 （15.37a) 式.所以，在正 
规方程组中有一个线性相 依性. 因此，4 了^解，就必须给 （15.37) 式添加一个线性独立的方程. 
一个合 乎逻辑的边界条件是 f ： f { = 0. 

用此条件，由 (15.37a) 得 


£..) = T XX 
























































































l . * 积标准正态分布 
n . t 分布的百分位败 

m . X s 分布的百分位 ft 
IV . f 分布的百分位败 

v . 固定效应棋型方差分析的抽检特性曲《 

VI . 随机触棋型方差分析的抽曲 

VII . 学生化贱统狀的百分 

VIU . 带 M 制的 Hi 较处理的 Dunnett « 

IX . 正交多项式的系数 

X . 2*-*»分式析因设计的别名关系 （fc < 









































































































































































































































